Tesla V100: Nvidia verschickt erstes DGX-1 mit acht NV-Link-Beschleunigerkarten

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu Tesla V100: Nvidia verschickt erstes DGX-1 mit acht NV-Link-Beschleunigerkarten

Nvidia nutzt seine HPC-GPU GV100 weiter, um sein Marketing anzukurbeln. Das im US-amerikanischen Boston ansässige Center for Clinical Data Science (CCDS) hat das erste DGX-1-System mit acht Tesla-V100-Beschleunigerkarten als SXM2-Modul mit NV-Link-2.0-Anbindung erhalten. Darauf werden neuronale Netzwerke trainiert, die Anomalien auf Untersuchungsbildern erkennen können sollen.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

lastpost-right.png
Zurück zum Artikel: Tesla V100: Nvidia verschickt erstes DGX-1 mit acht NV-Link-Beschleunigerkarten
 
jo wahrscheinlich is die nächte Titan ein GV104 und erst die übernächste Titan ein GV102

oder aber die nächste Titan ist ein GV102 und kostet min. 2000€

allerdings war die Fury X und Polaris auch keine Bedrohung und es gab trotzdem nen fetten GP102
 
Letzteres ist seit Monaten mein Tipp.

TitanX (Volta), GV102 teildeaktiviert, 24GB vRAM GDDR6 oder wahlweise 16 GB HBM2, ~50% schneller als die TXP, 1999$.
 
Volta - wenn man die Tensoren-kerne nutzen kann sind die Dinger wirklich ein Biest.
Nur so zum vergleich weil Vega hohe FP16 Leistung doch bekannt genug ist:
Vega64 - 27 TFlops
Tesla V100 - 120 TFlops

Nur halt das die Nvidia TFlops hier zweck-gebunden sind. Es sind reine FMA Matrix-Operationen. Diese werden dafür dann aber extrem effizient abgearbeitet und sind im allgemeinen recht unabhöängig von den Restlichen Cuda einheiten.


Nur für uns gamer bringt das nix, da wird es die Tensoren nicht geben, und auch müssten, zumindest unter DX12, die Entwickler spezielle dafür entwickeln - was dann jeder wieder laut bemängeln würde, und auch nicht wirklich sinnvoll ist.
 
Tensor-Vorteile bei GPUs sind vergleichbar mit AVX512 beispielsweise bei Skylake-X.
Bei Anwendungen die das stark ausnutzen werden die Chips extremst schnell, für den Normalsterblichen ist das alles aber mangels passenden Szenarien zumeist völlig nutzlos. Gamer-Chips werden die Tensor-Funktionen und ggf. DP-Einheiten erst gar nicht haben weil sie eh nicht genutzt werden beim spielen (und man sonst auch die Alleinstellungsmerkmale für Profikarten verlieren würde...).
 
Wozu sollte man die Tensor-Cores auch im Gaming nutzen?

Die FP32-Effizienz von Volta (50% effizienter bei FP32-Berechnungen), wird viel spannender :daumen:
 
Hm, ich hatte mehr das Problem, mein Knie ruhig zu halten. Auf ein paar Pixel zur Erkennung von Unregelmäßigkeiten bin ich da weit entfernt :ugly:
 
@Alki - hab ich ja schon gesagt, die Knoten wird es bei Konsumer-Karten nicht geben, aber nett wären sie alle mal.

Wozu sollte man die Tensor-Cores auch im Gaming nutzen?

Die FP32-Effizienz von Volta (50% effizienter bei FP32-Berechnungen), wird viel spannender :daumen:

Der Aufbau der Tensor-Knoten würde sie ideal für Viewport Transformationen machen.
In Spielen kann man sich den Ablauf so vorstellen: man Hat die Objekte (Landschafft, Spieler, Gegner) mit ihren Positionen und eine Kamera von der aus man alles sieht. Um jetzt herauszufinden wo sich etwas am Bildschirm befindet muss jeder einzelne Vertex (Punkte aus denen die Objekte bestehen) mit einer Kameramatrix multipliziert werden.
Das ist genau die Rechenart die diese Knoten beherrschen.

Es würde aber dazu führen das man speziell auf diese Knoten hin programmieren müsste was Entwicklungsresourcen verbraucht die für allgemeinere Verbesserungen dann fehlen.
 
Mit dem Kupferkühlkörper sieht das schon mal echt geil aus.
Wird das System passiv gekühlt oder sind da noch irgendwelche Lüfter am Gehäuse oder so?
Und was für eine Rechenleistung oder für jene Anwendungen würde das System hypotetisch oder real erreichen?
 
Mit dem Kupferkühlkörper sieht das schon mal echt geil aus.
Wird das System passiv gekühlt oder sind da noch irgendwelche Lüfter am Gehäuse oder so?
Und was für eine Rechenleistung oder für jene Anwendungen würde das System hypotetisch oder real erreichen?

Solche Serve-Schlitten haben generell auf einer seite eine Reihe von lüftern die durch den ganzen Kasten Luft durchpumpen. Eher das gegenteil von passiv - es ist meist recht laut.
Sieht dann schonmal so aus:
http://www.storagereview.com/images/StorageReview-Lenovo-ThinkServer-RD530-Fans.jpg

Rechenleistung?
Kommt vollkommen auf die anwendung an.
die Tensoren sind auf genau eine Berechnung ausgelegt - matrix-FMA. Wenn die Anwendung das brauchen kann dann bringt das 120 TFlops. Wenn nicht - 0 TFlops. Dann bleiben "nur" 5120 Cuda cores mit 15 TFlops.
 
Zurück