Mephisto_xD
BIOS-Overclocker(in)
AW: Nvidia Geforce RTX 2080 (Ti) in Aktion: Lüftergeräusch, Design und Leistung mit AI-Kantenglättung
Das ist dann natürlich unglaublich ineffizient, weil dein super platzfressender Tensorcore zu großen Teilen nur mit Nullen und Einsen multipliziert.
Übrigens ist die ganze Diskussion hanebüchen, weil die Tensorcores gar nicht FP32 können, bei denen ist bei FP16 Schluss. Es wäre also nicht nur ineffizient, sondern auch schlechter in der Präzision wenn man Shader Programme auf den Tensor Cores laufen ließe.
Außerdem gilt es zu bedenken, dass wenn man die IPC um 50% erhöhen kann ohne die maximale Rechenleistung zu steigern, dann wäre Pascal unglaublich ineffizient gewesen. Denn dann läge ja mindestens ein drittel der Papierleistung von Pascal in der Realität brach.
Da halte auch ich es für deutlich wahrscheinlicher, dass nVidia hier einfach eine Milchmädchenrechnung präsentiert hat. Man sollte nicht vergessen, dass das nicht das erste mal wäre. Bei der Vorstellung des ersten Tegras haben sie doch mal behauptet die Rechenleistung wäre größer als die von Xbox 360 & PS3. Aber während sie beim Tegra einfach alles zusammenaddiert haben, haben sie bei den Konsolen den Teil der Grafikkarte "vergessen"...
Du kannst Vektor und Matrixmultiplikationen auch mit Tensoren berechnen. Damit die zusätzliche Dimension nicht die Rechnung beeinflusst, füllst du die nicht benötigten Teile einfach so auf, dass sich effektiv eine Multiplikation mit der Identität ergibt. Quasi das Analogon zur Einheitsmatrix.Wieso wären die Matrizen sparse? Das verstehe ich nicht. Sparse heißt übrigens dünn besetzt, falls das jemand nicht weiß.
Das ist dann natürlich unglaublich ineffizient, weil dein super platzfressender Tensorcore zu großen Teilen nur mit Nullen und Einsen multipliziert.
Übrigens ist die ganze Diskussion hanebüchen, weil die Tensorcores gar nicht FP32 können, bei denen ist bei FP16 Schluss. Es wäre also nicht nur ineffizient, sondern auch schlechter in der Präzision wenn man Shader Programme auf den Tensor Cores laufen ließe.
Korrekt.Die IPC von FPUs in Grafikkarten ist seit mehr als einem Jahrzehnt bei exakt 2.
Die gleiche Rechnung passt auch noch immer auf die Turing Architektur, da wir ja die offizielle Angabe von 14 TF für die 2080 TI durch Nvidia haben.
Außerdem gilt es zu bedenken, dass wenn man die IPC um 50% erhöhen kann ohne die maximale Rechenleistung zu steigern, dann wäre Pascal unglaublich ineffizient gewesen. Denn dann läge ja mindestens ein drittel der Papierleistung von Pascal in der Realität brach.
Da halte auch ich es für deutlich wahrscheinlicher, dass nVidia hier einfach eine Milchmädchenrechnung präsentiert hat. Man sollte nicht vergessen, dass das nicht das erste mal wäre. Bei der Vorstellung des ersten Tegras haben sie doch mal behauptet die Rechenleistung wäre größer als die von Xbox 360 & PS3. Aber während sie beim Tegra einfach alles zusammenaddiert haben, haben sie bei den Konsolen den Teil der Grafikkarte "vergessen"...


