Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Das spricht alles noch immer nicht dagegen, dass man Tensor Kerne auch in "general compute workloads" mit einbinden kann.
Immerhin sind die Kerne ja Spezialisten für Matritzen.
Hab mir sagen lassen, dass die Dinger auch mal außerhalb von AI und Deep Learning auftauchen können.
Die Aussage von Alben kann man doch nun wirklich nicht missverstehen?!

The Tensor Core part is obviously very [significant] but even if you look at FP32 and FP64, we’re talking about 50 percent more performance in the same power budget as where we’re at with Pascal.

Heißt: Tensor Cores der eine Teil der neuen Architektur, Optimierungen für 50% höhere Perf/Watt bei FP32/FP64 der andere Teil.

Und das meint NVIDIA auch mit "general compute workloads".

ich glaube nicht dass das spezielle Einheiten sind, üblicherweise reichen für Deep Learning INT16 also nicht einmal INT32 daher erkründet sich der größte Teil des Zuwaches einfach dadurch dass in einer niedrigere Genauigkeit gerechnet wird, da werden nicht einfach neue compute units draufgepickt sondern die sind schon drauf.
Tensor Cores sind nicht einfach nur FP16 bei FullSpeed (wie das z.B. Vega kann), sondern sind spezielle Rechenoperationen für DL. Um genau zu sein ist es die Multiplikation zweier 4x4 Matrizen in FP16 Genauigkeit, zu der anschließend eine dritte 4x4 Matrix in FP16 oder FP32 addiert wird, das Ergebnis gibt es dann in FP16 oder FP32 Genauigkeit.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Auch wenn sich diese Karte an professionelle User/Wissenschaftler/AI & DeepLearing-Kunden richtet, die Tatsache dass Nvidia sie als 'Titan' labelt und ihr einen GeForce-Treiber (der Gaming addressiert) zur Seite stellt, wird zur Folge haben, dass die Titan V das Eis bricht, für eine neue Preisklasse und für eine generelle Erneuerung der Peisstaffelung aller (darunter befindlichen) Geforce-Karten. Hier wird (psychologische) Vorarbeit geleistet für weitere Gamer-Chip-Generationen (Ampere und Nachfolger).
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Auch wenn sich diese Karte an professionelle User/Wissenschaftler/AI & DeepLearing-Kunden richtet, die Tatsache dass Nvidia sie als 'Titan' labelt und ihr einen GeForce-Treiber (der Gaming addressiert) zur Seite stellt, wird zur Folge haben, dass die Titan V das Eis bricht, für eine neue Preisklasse und für eine generelle Erneuerung der Peisstaffelung aller (darunter befindlichen) Geforce-Karten. Hier wird (psychologische) Vorarbeit geleistet für weitere Gamer-Chip-Generationen (Ampere und Nachfolger).
Gibt es Spekulatius wegen der Weihnachtszeit nun schon umsonst? Die 1080 Ti war auch günstiger als von einigen Experten hier spekuliert, also locker durch die Hose atmen und abwarten :schief:
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Tja ...
Was soll man als Zocker dazu sagen !?

Viel Spaß, Wissenschaftler !

Wir warten auf Ampere.
Hoffe auf Vorstellung Ende März und bis Juni für die neuesten Gamer Karten, im Markt.
Eine GTX 2080 wäre nice. :)

Nun sieht man aber klar, dass Volta nicht für Spieler gedacht ist, sondern erst Ampere.
Oder wer kauft sich so ein Teil, was nicht auf Gaming ausgelegt ist, zum Zocken ? ^^ :what:
btw: Wo sind die Gaming Benchmarks ? :D
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Die Aussage von Alben kann man doch nun wirklich nicht missverstehen?!



Heißt: Tensor Cores der eine Teil der neuen Architektur, Optimierungen für 50% höhere Perf/Watt bei FP32/FP64 der andere Teil.

Und das meint NVIDIA auch mit "general compute workloads".


Tensor Cores sind nicht einfach nur FP16 bei FullSpeed (wie das z.B. Vega kann), sondern sind spezielle Rechenoperationen für DL. Um genau zu sein ist es die Multiplikation zweier 4x4 Matrizen in FP16 Genauigkeit, zu der anschließend eine dritte 4x4 Matrix in FP16 oder FP32 addiert wird, das Ergebnis gibt es dann in FP16 oder FP32 Genauigkeit.

Hier widersprechen sich White paper ab Seite 11 und Alben eben.
Das White Paper (kann man sich bei Nvidia runterladen) schließt die Tensor Kerne eben nicht bei der Optimierung aus.
Neben Cache, Scheduler und anderen Optimierungen werden sie eben auch im Rahmen der Effizienzsteigerung genannt.

Allerdings werden wir es ja sehen, sobald mal die ersten Reviewer Exemplare in den Händen halten - Ob die dann allerdings direkt von Nvidia kommen, wird sich noch zeigen müssen.
Gaming ist diesmal eindeutig nicht im Fokus der Karte.
Die ist eindeutig Prosumer Spielzeug.

Nvidia behauptet zwar das sich die Karte an "Professionelle Nutzer" richtet, das Design (geht noch mehr Bling Bling? Evtl. mit RGB) und der Geforce Treiber sprechen aber eine andere Sprache. Das war ja auch bei allen anderen Titanen so, da klang das Marketing immer gleich. Wenn die Karte auch nur ein paar Prozente schneller als die Xp ist wird sie denen auch aus den Händen gerissen...

Der Chip ist sehr für Deep Learning und KI optimiert.
Die Quadro Treiber bringen aber nur "Vorteile" wenn man mit CAD oder CAE arbeitet und die Zertifizierung braucht.
Entsprechend kann man hier komplett auf die Quadro Treiber verzichten.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Hier widersprechen sich White paper ab Seite 11 und Alben eben.
Nö, wo widersprechen sie sich denn? Nur weil du in die Aussagen des White Papers etwas dazu dichtest, was dort nicht steht. Alben stellt nochmal klar, dass sich die Perf/Watt-Optimierung, anders als von dir behauptet, ausschließlich auf reine FP32 und FP64-Berechnugen beziehen.

Das White Paper (kann man sich bei Nvidia runterladen) schließt die Tensor Kerne eben nicht bei der Optimierung aus.
Das stimmt nicht, das WhitePaper führt diverse Punkte auf, was bei Volta optimiert wurde und dort gibt es unterschiedliche Punkte für Tensor Cores und für FP32-Berechnungen - was NVIDIA eben unter "general compute workloads" führt. Und "general compute workloads" eben != "DL workloads", wo die Tensor Cores eine Rolle spielen.

Neben Cache, Scheduler und anderen Optimierungen werden sie eben auch im Rahmen der Effizienzsteigerung genannt.
Keiner dieser Punkte wurde als Grund für das bessere Perf/Watt genannt.

Allerdings werden wir es ja sehen, sobald mal die ersten Reviewer Exemplare in den Händen halten - Ob die dann allerdings direkt von Nvidia kommen, wird sich noch zeigen müssen.
Gaming ist diesmal eindeutig nicht im Fokus der Karte.
Die ist eindeutig Prosumer Spielzeug.
Um deinen Bullshit zu widerlegen, wird es reichen :daumen:
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Ach euer gelaber ist doch alles bla bla.
NV beschenkt uns wieder mit der schnellsten Grafikkarte, dazu ein Spot Preis. Wer da nicht hinlangt ist selbst schuld.
Ich hab mir direkt 4 Stück bestellt!
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Was soll dort getrennt sein? Cuda 9 oder Cuda C++ ist letztlich eine FP32 result convertierung und lässt sich Low Level nur via CUDA libraries ausführen.
Beachte den Threadverlauf. Khabarak versucht Volta als Pascal-Refresh zu verkaufen und weigert sich die Zahlen von NVIDIA für die Perf/Watt-Verbesserungen bei FP32/FP64 Berechnungen anzuerkennen. Obwohl Alben das nun wirklich komplett eindeutig erklärt hat.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

wird zur Folge haben, dass die Titan V das Eis bricht, für eine neue Preisklasse und für eine generelle Erneuerung der Peisstaffelung aller (darunter befindlichen) Geforce-Karten.

Sie können es versuchen.
Aber glaube nicht, dass das funktioniert.

Man sieht ja die Zurückhaltung bei den Spielern, die sich Preise von 5-800€ nicht leisten wollen, sondern wie früher eher in der 2-300€ Liga kaufen.
Jedenfalls kann man das nicht unendlich so weiterspielen, mit den Preiserhöhungen, denn irgendwo is mal die Preisgrenze jedes Einzelnen erreicht und dann wendet man sich von den Top Produkten ab und kauft einfach was kleineres.

Evtl. schraubt man dann seine kompletten Ansprüche einfach wieder runter und sagt sich: Wozu WQHD, UWQHD, UHD, wenn's 1080p auch tut ?
Nicht jeder ist bereit 700+ € für eine GPU auszugeben.

Die Zielgruppe "da oben" ist schon eine kleine.

Und je höher der Preis, desto kleiner wird die Gruppe. Is doch logisch.
Es könnte sogar ein Umkehrtrend stattfinden, nach dem Motto: Dann verzichte ich eben drauf.

Die sollten das Ausquetschen der Konsumenten nicht übertreiben.
Die allgemeinen Preise für Highend Hardware sind momentan schon enorm. Auch für Ram usw. .

Man kann auch mit weniger zocken. Es muss nicht unbedingt High-End sein.
Das ist eine Gratwanderung, die sie nicht übertreiben sollten, bei Nvidia und co.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Und eine Vega FE kauft man heute ab 695...mit vollem HBM2 Ausbau ala 16GB.:)

Radeon Vega -> Grafikkarten (VGA) -> Hardware | Mindfactory.de - Hardware, Notebooks & Software bei

NVidias typische Resteverwertung für viel Geld. Das kommt davon wenn alle nach Volta schreien.:D

Das sind auch nur umgelabelte AMD Vega (Gamerkarten) mit bisschen mehr VRAM - und die haben aber weder Nvidia CUDA 9 Compute & Programming Support noch Tensor-Cores für effizientes Deep Learning / Training samt Unterstützung & Support für alle führenden Deep Learning Frameworks .... wie z.B. Tensorflow, PyTorch, MXNet, Caffe2 .... uvam.
Programming Tensor Cores in CUDA 9 | Parallel Forall

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

AMD's TFlop auf dem Papier bringen in der Praxis nichts - wenn der professionelle Support fehlt. Keiner kauft diese AMD Vega 'ProfiKarten' mit grottigen Treibern - darum werden die so billig verschleudert - da schon bald EOL ( End of Life ).
 

Anhänge

  • Nvidia Tensor Cores in Cuda 9.png
    Nvidia Tensor Cores in Cuda 9.png
    76,2 KB · Aufrufe: 39
Zuletzt bearbeitet:
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

2018

Geforce 1130 - 200 Euro
Geforce 1150 - 350 Euro
Geforce 1160 - 500 Euro
Geforce 1170 - 750 Euro
Geforce 1180 - 999 Euro
Geforce 1080ti - 1599 Euro
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Nochmal zum Mitschreiben da hier einiges an Blödsinn verbreitet wurde:

1 - die Karte ist zum Spielen geeignet, aber die Zielgruppe sind wohl diejenigen die DeepLerning oä betreiben denn nur da bringen die Tensorknoten etwas - und dort sogar Gewaltig.
2 - es ist KEINE Quadro - sie besitzt nicht die zertifizierten Treiber die für so einiges an professioneller Software nötig ist. Ohne die Signierung läuft dort garnichts.
3 - Der Preis ist für Gamer extrem teuer, aber für DL wirklich billig - 110 TFlops bei der Stromaufnahme ist um Welten besser als alles andere.
4 - Die Effzienz ist um ~50% gestiegen in ALLGEMEINEN Workloads - das heist exklusive Tensorknoten (kann sich auch jeder zusammenreimen der noch in der Lage ist zu denken: Mit Tensorknoten ~4x Leistung, aber selber Verbrauch. das sind dan doch ein biiiischen mehr als 50%)
5 - 3x 4Gb bieten mehr Bandbreite - HBM2 ist nunmal auf 1024bit@2GT limitiert. hier wurde nicht das Interface beschnitten sondern der Speicher so günstig wie möglich gehalten. Fürs Spielen reichen die 12 Gb aus und auch für das Einsatzgebiet DL wird nicht mehr benötigt. 4x4GB wären natürlich schöner gewesen.
6 - Tensorknoten sind Spezialhardware die nur eines können und das ist FMA4 mit 16bit Multiplikation und 16/32bit Kumulation. Sie können auch für nichts anderes eingesetzt werden - keine 32bit Addition, auch keine generellen 16bit Operationen - dadurch erreichen sie ihre extreme Effizienz.

und weil hier mit Vega verglichen wurde:
frontier Edition und auch vega64 - beide haben zwar mehr VRam, aber deutlich weniger Bandbreite und das das ein Problem ist sieht man deutlich an der vega56 die, wenn der VRAM auf niveau der 64 gehoben wird stark an Leistung zunimmt.
Und für deeplerning wird nicht viel Speicher benötigt, der muss aber flott angebunden sein.
Und da es einige noch immer nicht bemerkt haben: schon Maxwell (GM2xx) hatte Featurelevel 12_1. Die Aussage das nvidia kein Async-Compute unterstützen würde ist einfach nur Falsch - das Gegenteil ist der Fall: Bereits unter Dx11 hat der nvidia Treiber/Sheduler Computeaufgaben asynchron eingebetet und das deutlich besser als jeder Spiele/Benchmarkentwickler. Dadurch gibt es bei Nvidia mit Dx11 selbst mit Compute-Workloads eine Coreauslastung von über 90% ( wovon man bei Ashes of the benchmarks nur träumen kann).


Die Karte ist Teuer, aber mehr noch als die vorherigen Titans auf eine kleine Nische an Benutzern zugeschnitten. man kann sie fürs Spielen nutzen - und sie wird dort auch gut laufen - nur dann kann man gleich sein Geld verheizen.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Tensors werden per Libraries in cuBLAS und cuDNN angesprochen, es kommt dabei nicht immer auf die Hardware an, sondern wie effizient sie in ihren Softwareumfeld programmiert werden kann. Effizienz definiert sich dabei nicht immer in geringer Leistungsaufnahme, sondern doppelt so hohen Fließkommaberechnungen.
Du hast - sorry - immer noch nicht verstanden, worum es geht :rolleyes:

NVIDIA bezieht die Effizienzsteigerungen von Volta ausschließlich auf die Berechnung von FP32/FP64-Werte und nicht auf die zusätzlichen TensorCores. Diesen Fakt weigert sich Khabarak anzunehmen, auch wenn es ihm mehrfach und von mehreren Usern erklärt wird.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Und wie so häufig: Die Anzahl der FLOP/s machen nur innerhalb einer Architektur Sinn und es lässt sich erst Recht nicht auf die allgemeine Rechenleistung rückrechnen oder so.
Daher bleibt vollkommen offen, wie sich die Grafikkarte in Spielen schlägt - oder noch allgemeiner: in Szenarien, in denen die Tensor-Cores nicht ihre volle Leistungsfähigkeit ausspielen können. Also wahrscheinlich in 99% der Anwendungsfälle.
gRU?; cAPS

Oh sicher, 100%ig wird diese Abschätzung nicht stimmen. Und ich stimme dir zu, im Allgemeinen sind solche Vergleiche Unsinn, sieht man ja auch an den AMD Karten, die auf dem Papier deutlich mehr können als in der Praxis dann auf dem Monitor ankommt.

Aber guck dir mal das Architekturdiagramm an, und vergleiche es mit dem von Pascal, da hat sich nicht viel mehr geändert als z.B. von Maxwell auf Pascal. Und den Maxwell-->Pascal Performancesprung konnte man eben sehr gut mit den "nackten Zahlen" abschätzen.

Deswegen meine Prognose: In Spielen wird die Karte vielleicht 20% schneller als eine Titan Xp@Stock, aber viel mehr wird es nicht.
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Ach euer gelaber ist doch alles bla bla.
NV beschenkt uns wieder mit der schnellsten Grafikkarte, dazu ein Spot Preis. Wer da nicht hinlangt ist selbst schuld.
Ich hab mir direkt 4 Stück bestellt!

du lügst doch !!!!
pro kunde sind nur 2 karten erlaubt :nene::D
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Titan V für Nvidia Deep Learning Cuda SDK Libraries wie cuDNN, NCCL und TensorRT

FP16: 27.6 TFLOPS (Vec2) + 110 TFLOPS (Tensor)
FP32: 13.8 TFLOPS
FP64: 6.9 TFLOPS

AMD Vega FE für Do-it-yourself OpenCL, open-source ROCm, HSA

FP16: 26.2 TFLOPS
FP32: 13.1 TFLOPS
FP64: 0.86 TFLOPS
 
Zuletzt bearbeitet:
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Ein Spielbenchmark wäre sicher mal interessant ;) (am Besten wassergekühlt und stark übertaktet).
 
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar

Ich weiß jetzt nicht was du so lustig findest. Nvidia schraubt gerade die Preise für Grafikkarten in die Höhe (mangels Konkurenz ganz logisch), man kann sie ausmalen das die Lücke unter der Karte nicht so groß bleiben wird.

Nvidia behauptet zwar das sich die Karte an "Professionelle Nutzer" richtet, das Design (geht noch mehr Bling Bling? Evtl. mit RGB) und der Geforce Treiber sprechen aber eine andere Sprache. Das war ja auch bei allen anderen Titanen so, da klang das Marketing immer gleich. Wenn die Karte auch nur ein paar Prozente schneller als die Xp ist wird sie denen auch aus den Händen gerissen...

Wenn sie die 110 TFLOPS als Grafikleistung auf die Straße bringen ist die Karte nur 9,17 (817%) mal schneller als ihr direkter Vorgänger die Titan XP. Sprich statt 60 FPS in UHD hättest du satte 550 FPS ... Du würdest locker 138 FPS auf 8K Monitoren haben. Der erste 8K-Fernseher kommt März 2018 auf den Markt über den Preis ist nichts bekannt.
Sollte NVidia es geschafft haben die Grafikleistung mal eben in einer Generation zu verneunfachen also um 817% zu steigern, dann wären 3000 € kein Wucher sondern ein echtes Schnäppchen. 817% sind nicht ein paar Prozente.

Wird dir jetzt klar warum ich hier lache?

Diese Karte ist nicht mal entfernt eine Gaming-Grafikkarte, sondern ein für eine speziellen Zweck geschaffene Karte. Und das sie die Form hat, die sie hat, ist ihren Einsatzort geschuldet ... Einen PCI-E -SLOT. Erfordert nunmal schlanke längliche Karten.
 
Zuletzt bearbeitet:
Zurück