Hallo Forum,
welche Produkteigenschaften einer Spiele Grafikkarte zeigen, wie performant eine lokale KI Anwendung laufen wird und welche Grafikkarte dafür geeigneter wäre?
Bei NVIDIA gibt es die Tensor Cores, aber eine schnellere AMD Grafikkarte wird irgendwann trotzdem auch für das machine learning schneller sein.
Reicht es alleine die Rechenleistung (FP16, FP32, FP64) der Grafikkarten zu vergleichen oder kommt die Tensor Cores Leistung zusätzlich dazu?
Beispielsweise folgende beiden Grafikkarten sind preislich ziemlich nahe beieinander. Für PC Spiele ist die AMD deutlich leistungsfähiger als die NVIDIA, aber gilt das auch, wenn eine Nebenanwendung das machine learning einer lokalen KI ist?
Gainward GeForce RTX 3060 Ghost, 12GB GDDR6
Rechenleistung: 12.74 TFLOPS (FP16), 12.74 TFLOPS (FP32), 0.2 TFLOPS (FP64)
Chip-Konfiguration: 28SM (3584 ALUs / 112 TMUs / 48 ROPs), 28 RT Cores, 112 Tensor Cores, 3MB L2-Cache
Sapphire Pulse Radeon RX 6700 XT, 12GB GDDR6
Rechenleistung: 26.43 TFLOPS (FP16), 13.21 TFLOPS (FP32), 0.83 TFLOPS (FP64)
Chip-Konfiguration: 40CU (2560 ALUs / 160 TMUs / 64 ROPs), 40 RT Cores, 3MB L2-Cache, 96MB L3-Cache
Gruß
welche Produkteigenschaften einer Spiele Grafikkarte zeigen, wie performant eine lokale KI Anwendung laufen wird und welche Grafikkarte dafür geeigneter wäre?
Bei NVIDIA gibt es die Tensor Cores, aber eine schnellere AMD Grafikkarte wird irgendwann trotzdem auch für das machine learning schneller sein.
Reicht es alleine die Rechenleistung (FP16, FP32, FP64) der Grafikkarten zu vergleichen oder kommt die Tensor Cores Leistung zusätzlich dazu?
Beispielsweise folgende beiden Grafikkarten sind preislich ziemlich nahe beieinander. Für PC Spiele ist die AMD deutlich leistungsfähiger als die NVIDIA, aber gilt das auch, wenn eine Nebenanwendung das machine learning einer lokalen KI ist?
Gainward GeForce RTX 3060 Ghost, 12GB GDDR6
Rechenleistung: 12.74 TFLOPS (FP16), 12.74 TFLOPS (FP32), 0.2 TFLOPS (FP64)
Chip-Konfiguration: 28SM (3584 ALUs / 112 TMUs / 48 ROPs), 28 RT Cores, 112 Tensor Cores, 3MB L2-Cache
Sapphire Pulse Radeon RX 6700 XT, 12GB GDDR6
Rechenleistung: 26.43 TFLOPS (FP16), 13.21 TFLOPS (FP32), 0.83 TFLOPS (FP64)
Chip-Konfiguration: 40CU (2560 ALUs / 160 TMUs / 64 ROPs), 40 RT Cores, 3MB L2-Cache, 96MB L3-Cache
Gruß