Du sagst "ein System mit dedizierter GPU kann nicht..." .
Ich sage "eine GPU kann sehr wohl...". Man beachte, dass da nirgendwo was von System steht.
Deine Aussage mag volllkommen richtig sein, die passt aber schlichtweg nicht auf die Fragestellugn. Man hat keinerlei Übertragungsoverhead, wenn man keinerlei Daten überträgt, sondern die Berechnungen einfach komplett auf der GPU ausführt.
Die mag bei komplexerer Logik zwar gnadenlos ineffizient im Vergleich zur CPU sein, aber im Vergleich zu einer PS4 iGPU wird eine GPU des Jahres 2016/2017 soviel Rohleistung haben, dass sie sich diese Leistungsineffizienz erlauben kann. Und die Latenzen sind, selbst wenn die GPU deutlich mehr Zyklen für diesen Teil der Berechnung braucht, immer noch nicht höher, als bei einer Übertragung an die passendere CPU in der PS4.
Das Gleiche gilt umgekehrt für Aufgabenstellungen, die nur zu kleinem Teil von einer Berechnung auf einer GPU profitieren:
In der PS4 wird man hocheffizient den CPU-orientierten Teil auf der CPU berechnen, dann ratzfatz die paar kritischen Elemente an die iGPU auslagern und da hocheffizient berechnen.
In einem PC des Jahres 2016 wird man hocheffizient den CPU-Teil auf einem halben Kern berechnen, der nebenbei noch drei Krebsmedikamente faltet und in einem Zehntel der Zeit, die die PS4 CPU dafür gebraucht hat. Und für den iGPU-Teil wird man dann halt mal die anderen 9 bis 15 CPU-Kerne anschmeißen müssen. Die sind bei dieser Berechnung zwar höllisch ineffizient im Vergleich zur PS4-iGPU, aber sie haben wiederum so brachiale Rohleistung für Logikberechnungen übrig, dass sie trotzdem rechtzeitig fertig werden.
Man darf dabei ja schließlich nie vergessen, dass die iGPU in der PS4 kein Logik-Coprozessor ist, sondern in aller erster Linie mal der primäre Renderer. Undzwar einer, der schon heute im Vergleich zu PC-GPUs nicht übermäßig stark wirkt, aber in Zukunft die gleiche Grafikqualität in vergleichbaren (oder ggf. sogar 4x größeren) Auflösungen stemmen soll. Da bleibt nicht viel übrig für gpGPU. Wenn die Entwickler 5-10% für solche Aufgaben abzweigen können, dann ist das viel. Und davon werden sie den Löwenanteil noch für Partikeleffekte nutzen, denn die sind nun einmal ein Musterbeispiel für feingranuläre, GPU-o-phile Aufgabenstellungen in modernen Spielen. Und sie lassen sich komplett, ohne Overhead, auf einer dedizierten GPU berechnen.
Für Berechnungen, die tatsächlich so kritisch sein
könnten, wie du es beschreibst, steht vielleicht ein Promill der Rechenleistung der PS4 iGPU zu Verfügung. Das sind weniger Flops, als ein 3770K haben dürfte und wir reden von Spielen, die auf einem 7777K laufen werden. Mehr als genug Reserven für schlecht angepassten/anpassbaren Code also