Ich habe es aber schon mehrmals ausgeführt und ich erinnere mich das du in mindestens einem der Threads auch aktiv warst.
Dinge wie die neue ISA, dass die meisten Instruktionen nun in 4 Zyklen berechnet werden, anstatt in 6, dass neue Cache-System.
Daneben gibt es auch getrennte FP/INT-Ports und jeder Thread hat einen eigenen Progam Counter und nicht nur der ganze Warp bestehend aus 32 Threads, Volta kann bei Bedarf die Threads sehr granular verwalten und die Möglichkeit besitzt bisher keine AMD/Nvidia GPU.
Daneben hat Nvidia auch den Dual-Dispatcher entfernt.
All die Informationen hat Nvidia schon am Anfang vom Volta Reveal preisgegeben, man konnte viele Dinge im Blog lesen und etwas ausführlicher im White-Paper.
http://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf
Und wer Lust hat kann sich Voltas neues Instruction Encoding im Detail anschauen, Citadel hat dazu, zu der Cache-Hierarchy, dem Scheduling-Schema usw. mehrere Analysen und Micro-Benchmarks durchgeführt:
https://arxiv.org/pdf/1804.06826.pdf
Volta ist allgemein eine neue Architektur und setzt viele Dinge anders um, als Maxwell/Pascal.