AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert
Die Auslastung ist kein fest definierter Begriff, besonders nicht der Unsinn den du geschrieben hast. Sobald die GPU aktuell nicht mehr Ressourcen zur verfügen stellen kann für Compute Berechnungen, ist sie Ausgelastet und Async Compute bringt dann wenig. Eine GPU und ihre Speicherhierarchien ist bei hohen Auflösungen durch das Rendering sehr schnell Ausgelastet.
Doch ist sie, dein Logo ist Computer Science und du hast hier schon soviel Posts geschrieben und dann schreibst so einen Schwachsinn
Wenn eine GPU 2 TFlops leisten kann, was die maximale Leistungsfähigkeit darstellt welche eine GPU xy zu leisten vermag dann ist die maximal mögliche Auslastung sehr wohl definiert, mehr geht nicht hauptsächlich abhängig von der Anzahl der Register. Die maximal theoretischen Flops kann man auch berechnen und sind unabhängig vom Speicherzugriff deswegen Peak Performance weil es sich nur um die Register bzw. Compute Einheiten handelt.
Floating Point Operations Per Second – Wikipedia
How to calculate peak theoretical performance of a CPU-based HPC system
wenn du z.b a+b=c rechnest dann sind ist das ein Flop und wenn du das 100 mal machst sind das 100 Flops aufgrund der Addition , Ist gleich kann als Flop gezählt werden oder nicht, wenn du 100 Flop machst und das pro Sekunde sind das 100 Flop / s = 100 Flops (die schreib weise ist hier nicht eindeutig)
nur hat man halt nicht nur Register vor sich in einem CPU oder GPU, sondern auch Speicherzugriffe oder eben die Architektur selbst daher ist es relativ unwahrscheinlich dass du 100 Flop/s erreichst sondern eben nur eine Bruchteil davon auch die Kontrolllogik um diese Operationen zu steuern kostet Ressourcen aber vor allem auch Speicherzugriffe, daher ist es unwahrscheinlich dass man die 100 Flop/s erreicht
statt dessen führt man eben die relativen Flop/s ein = erreichte Flop/s / maximale erreichbare Flop / s in % die man mit verschieden Benchmarks und Programmen misst und von Programm zu Programm abhängt aber der Zähler bleibt halt einfach fix pro GPU bzw. CPU, mehr als 100 % geht nicht, daher kann man nicht sagen es gibt einen bestimmte Zahl für eine GPU
unter anderem werden die Flop/s durch ungünstige Speichzugriffe heruntergesetzt weil die GPU einfach nicht rechnen kann wenn die Latenzen zu hoch sind für einen Speicherzugriff (die Register sind einfach blockiert weil die Daten noch nicht zur Verfügung stehen)
ein Auto kann ja auch nicht mehr als 100 PS leisten und das verhält auch ähnlich zu maximale erreichbare Flop / s
für die Matrix * Matrix Multiplikation erreicht man zwischen 90 bis 95 % der Peak Performance auf einer GPU und das für einen Algorithmus der sehr einfach ist und wo sich schon sehr viele Techniker und Wissenschaftler damit beschäftigt haben und du sagst einfach mal so übers Knie man erreicht die eine 100% Auslastung sehr schnell -> einfach Blödsinn
bei Spielen ist man sehr weit weg von den 100 % ist auch sehr schwer an zugegeben wie viel wirklich erreicht wird aber der Code meistens zu komplex