AW: Playstation 4: Als "Omni" mit 4K-3D-Brille ab Herbst 2013 im Handel?
Gerade bei Spielen hat die GPU mehr als genug zu tun. Da bleiben kaum Ressourcen übrig um dann auch noch die Arbeit der CPU zu übernehmen. Es ist im Gegenteil oftmals genau umgekehrt, in der Form, als das Berechnungen, die die GPU auch übernehmen könnte auf die CPU ausgelagert werden, wie z.B. Physikberechnungen, um die GPU zu entlasten.
Nein, gerade bei Spielen kann sie das nicht, da sie ziemlich ausgelastet ist. Spiele lassen sich überhaupt nicht mit dem Alltagsbetrieb vergleichen. In Spielen ist die GPU zu 99% ausgelastet. Im Alltagsbetrieb liegt die Rechenleistung zu 99% brach d.h. im Alltag kann GPGPU enorm beschleunigen, weil man Aufgaben, die die GPU viel schneller erledigen kann, auf diese auslagert. Aber in Games ist genau das eben nicht drin bzw. kontraproduktiv, weil die GPU ausgelastet ist. Deswegen bringt HSA in Games nicht den Vorteil, den es bei Anwendungen hat, außer natürlich was Latenzen etc. angeht, aber nicht bei der reinen (Gaming-)Leistung.
Nun Physik ist nicht gleich Physik und Animationen nicht gleich Animationen und K.I nicht gleich K.I.
Bei einer PS3 kannst du so Zeug von der "CPU" übernehmen lassen, da hast du auch deine 6 128-Bit FP-Pipelines oder bei limitierten Physik-Sachen kannst du das auch auf eine "normale" CPU schieben, ansonsten erledigst du das alles effizienter mit der GPU.
Tim Sweeney dazu:
Tim Sweeney: DirectX 11 ist ein fundamentaler Richtungswechsel, weg von der "alten Schule" der Grafik-Entwicklung. Mehr als 50 Prozent der genutzten GPU-Zeit im UE4-Demo "Elemental" wurde erstmals für allgemeine Berechnungen statt für die Standard-Grafik-Pipeline verwendet. Das hat es uns ermöglicht, viele neue Algorithmen wie GPU-beschleunigte "zustandsorientierte" Partikel und SVOGI (Sparse Voxel Octree Global Illumination) zu implementieren, eine Technik, die allgemeine indirekte Beleuchtungen und glänzende Reflexionen dank der enormen Kapazitäten einer High-End-GPU komplett berechnet. Wenn ein Algorithmus massiv parallel abgearbeitet werden kann, bietet eine 3-TeraFLOP-GPU enorme Vorteile gegenüber einer 100-GigaFLOP-CPU.
Das mit den Spielen was du erwähnst ist auch sehr pauschal. Du hast dein processing budget und es steht dir als Entwickler frei zu entscheiden, wie du dieses einteilst.
50% Grafik, 50% Physik oder doch eher 80% Grafik und 20% Physik oder 60% Grafik 30% K.I-Lemminge und 10% für paar Partikel drum herum?
Die heutigen Devs stecken die Rechenleistung ja auch nicht in höhere Auflösungen und MSAA, sondern lassen lieber rechenschonend FXAA drüber laufen und stecken die Rechenleistung nur in das Spiel rein.
Es wird bei der Next-Gen niemanden hindern, einen guten Teil der Rechenleistung auch an die Physik oder K.I-Berechnung aus zu lagern, soweit es effizient ist.
Außerdem verstehe ich deine Sicht von Alltagsbetrieb und Games nicht. Das was parallel abgearbeitet wird portiert man auf die GPU, da auch viel effizienter und perfekt geeignet dafür und das was seriell abgearbeitet wird bleibt bei der CPU.
Damit wird weder im Alltag noch in Games alles auf der GPU laufen oder der Großteil auf der CPU.
HSA bringt dir übrigens bei fast JEDER Anwendung Performance.
Mit einem gemeinsamen Adressraum und dem kohärenten Speicher, sparst du bei jeder Berechnung, wo die Kommunikation von von CPU und GPU zum Einsatz kommt, Latenz-Zeiten und den Kopieroverhead, was auch die Bandbreite extrem schont.
Nvidia hat dazu offen gelegt, dass Heutzutage das verschieben von Daten mehr kostet, als die Berechnung dieser! Da kann man sich schon vorstellen, dass einige Watt eingespart werden können.
Das alles ist revolutionär! Seit es PCs gibt, musst du ständig die Eingabedaten sowohl bei der CPU, als auch bei der GPU speichern, weswegen bei Berechnungen die ein zu häufiges "Ping-Pong" Prinzip benötigen, einfach am Overhead ersticken.
Das wird jetzt alles entfallen und spart damit Performance und Energie bei der GPU und der CPU.
Das könnte auch zu ganz neuen Algorithmen führen, die man bisher nicht in Betracht gezogen hat, da der Overhead einfach zu groß für eine effiziente Berechnung war.
Das ganze Konzept ist einfach genial, aber es ist natürlich nicht richtig, dass man deswegen alles auf die GPU auslagern kann oder gar sollte.