Sonnenkoenig
PC-Selbstbauer(in)
AW: Nvidia Titan V: Volta mit 110 TFLOPS und HBM2 für 3.000 US-Dollar
Heißt: Tensor Cores der eine Teil der neuen Architektur, Optimierungen für 50% höhere Perf/Watt bei FP32/FP64 der andere Teil.
Und das meint NVIDIA auch mit "general compute workloads".
Die Aussage von Alben kann man doch nun wirklich nicht missverstehen?!Das spricht alles noch immer nicht dagegen, dass man Tensor Kerne auch in "general compute workloads" mit einbinden kann.
Immerhin sind die Kerne ja Spezialisten für Matritzen.
Hab mir sagen lassen, dass die Dinger auch mal außerhalb von AI und Deep Learning auftauchen können.
The Tensor Core part is obviously very [significant] but even if you look at FP32 and FP64, we’re talking about 50 percent more performance in the same power budget as where we’re at with Pascal.
Heißt: Tensor Cores der eine Teil der neuen Architektur, Optimierungen für 50% höhere Perf/Watt bei FP32/FP64 der andere Teil.
Und das meint NVIDIA auch mit "general compute workloads".
Tensor Cores sind nicht einfach nur FP16 bei FullSpeed (wie das z.B. Vega kann), sondern sind spezielle Rechenoperationen für DL. Um genau zu sein ist es die Multiplikation zweier 4x4 Matrizen in FP16 Genauigkeit, zu der anschließend eine dritte 4x4 Matrix in FP16 oder FP32 addiert wird, das Ergebnis gibt es dann in FP16 oder FP32 Genauigkeit.ich glaube nicht dass das spezielle Einheiten sind, üblicherweise reichen für Deep Learning INT16 also nicht einmal INT32 daher erkründet sich der größte Teil des Zuwaches einfach dadurch dass in einer niedrigere Genauigkeit gerechnet wird, da werden nicht einfach neue compute units draufgepickt sondern die sind schon drauf.







(am Besten wassergekühlt und stark übertaktet).