AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Pu244 · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Warum haben sie nicht ihren Centurion und die R9-290X genommen?

mit insgesamt 500W TDP kann man wesentlich besser Sandwiches Toasten als mit den popligen 100W der APU.

Gamer090 · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Witziges Video von AMD und wusste nicht das APUs wissen wie ein Sandwich gemacht wird.

Und ich mach es immer selbst?

PCGH_Torsten · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

rehacomp schrieb:
Hmm , was ist sinnvoller.

Nur 1 Sandwiche schnell fertig, dann das nächste
oder
10 sandwiches auf einmal, dafür dauert es länger

Zuhause nehme ich variante 1, da kann ich schon 1 essen wären ich das nächste mach.
Im Restaurant wär es nicht so toll, wenn alle essen nacheinander kämen.

Hier wie da wären weniger trockene Sandwiches schön. Soße? Gemüse? Brauch ich Nvidia-GPUs für Sandwiches mit grüner Gurke statt rotem Schinken? Und Hydra-Multi-GPU für etwas leckeres? Und: Gibt es CPUs, die Sandwichs mit mehr als einem Kern und schneller, als eine CU bearbeiten? Ich will jetzt jedenfalls einen Toaster mit DX9, der Geometrie-Instancing unterstützt.

Anm.: Ggf. ist dieses Video nicht für Ners und/oder Sandwich-Esser geeignet

eiven schrieb:
Die Erkennung wann Parallelisierung möglich ist oder nicht stelle ich mir auch schwer vor, mit Compiler Befehl sicherlich möglich aber "on the fly" sicherlich schwierig.

Intels IA64-Architektur setzte auf Vorsortierung durch den Kompiler. Itanium gilt trotzdem als Flop.

JackA · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Ich sehe die Zukunft in APUs.
Brauchbare Leistung, in kleine Gehäuse baubar und nur noch eine Einheit zu kühlen (außer dem Netzteil).
Wenn jetzt die Spiel-Performance noch verbessert wird, dann ziehe ich meinen Hut (sollte eigentlich nicht die APU von der PS4 nicht auch ähnlich für den PC erscheinen, der 7850k wird ja nicht an PS4 Niveau kommen?)

PCTom · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Um die Mittagszeit sollte man sich son etwas nicht anschauen HUNGER

Shirozen · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Ich hätte nichts gegen eine APU einzuwenden

. Wenn die Leistung irgendwann stimmt kann ich mir gut Vorstellen eine AMD Apu als mItx zu basteln, solang aber die Leistung nicht annähernd einer "normalen" Cpu + Grafikkarte heranreicht brauch ich mir erstmal nicht den Kopf zerbrechen. Ich habe mir erstmal 1 Intel System gekauft da es keine AM3+ mItx Boards gibt, schade für AMD.

TroaX · 26. September 2014

JackA$$ schrieb:
Ich sehe die Zukunft in APUs.
Brauchbare Leistung, in kleine Gehäuse baubar und nur noch eine Einheit zu kühlen (außer dem Netzteil).
Wenn jetzt die Spiel-Performance noch verbessert wird, dann ziehe ich meinen Hut (sollte eigentlich nicht die APU von der PS4 nicht auch ähnlich für den PC erscheinen, der 7850k wird ja nicht an PS4 Niveau kommen?)

Die PS4 Apu ist ein alter Jaguar. Soweit ich weiß müsste der Kaveri schneller sein.

Die Schleife würde nun in 100 einzelne Berechnungen geteilt und jeweils an eine APU geleitet werden und so parallel abgearbeitet werden.

Und genau da ist der Fehler.
Schleife 100x Lebenspunkte +1 bei Ausgangswert 0 = 100 Lebenspunkte
100x Lebenspunkte + 1 bei Ausgangswert 0 ohne Schleife = 100 x 1 Lebenspunkt
Das sind, wenn man sie zusammenführt zwar auch 100 Lebenspunkte. Aber was passiert, wenn du beim hochzählen angegriffen wirst?

Du musst diese parallelen Aufgaben als Subthreads sehen. Du hast eine Variable "lebenspunkte = 0". Bei jedem Schleifendurchlauf wird dieser um 1 erhöht, bis er 100 hat. Brichst du dies aber auf und verteilst diesen Vorgang auf 100 verschiedene Recheneinheiten, arbeitet jede einzelne mit dem Basiswert 0. Jede Recheneinheit rechnet aber nur einen einzigen dazu. Also kommt bei jeder Einheit das Ergebnis 1 raus. Und nun? Willste die Ergebnisse mit einer Schleife einfangen und dann noch einmal drauf addieren?

Genauso ist es mit der Änderung einer Variable zur Laufzeit. Du wist angegriffen und verlierst Lebenspunkte. Das geht, indem du eine entsprechende Abfrage in die Schleife setzt oder Threadunsafe programmierst. Welche der 100 Recheneinheiten kann sich dann auf die neue Situation anpassen?

AMD hat nur das Prinzip von Multithreading in dem Video gezeigt. Die Sandwichgeschichte hat also streng genommen mit HSA noch garnichts zu tun. Wie die Aufteilung an die Recheneinheiten per HSA stattfindet, ist noch blanke Theorie. Wirklich überzeugen kann das ganze nicht.

Pu244 · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

TroaX schrieb:
Die PS4 Apu ist ein alter Jaguar. Soweit ich weiß müsste der Kaveri schneller sein.

Der CPU Teil ja, der GPU Teil nein.

Das Problem ist das man auf GDDR5 RAM mit einem 256 Bit Interface setzt, somit würde es auf eine teure Speziallösung rauslaufen die bestenfalls für hochintegrierte Media PCs interessant ist.

TroaX · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Pu244 schrieb:
Der CPU Teil ja, der GPU Teil nein.

Das Problem ist das man auf GDDR5 RAM mit einem 256 Bit Interface setzt, somit würde es auf eine teure Speziallösung rauslaufen die bestenfalls für hochintegrierte Media PCs interessant ist.

Ja aber der Video-Arbeitsspeicher ist das Problem jeder APU. Denn der wird ja vom Systemspeicher abgeknappst. Ausnahmen sind eben die APU's in Konsolen. Da diese Chips ja nur in den Teilen werkeln sollen sind sie in der Lage, ähnlich wie bei Graka's andere Speicher auf die Platine zu pflanzen. Das wird im Desktopsekment schwer. Es sei denn dafür wird ein neuer Sockeln entwickelt, mit dem man GDDR-Speicher nachrüsten kann.

eiven · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

TroaX schrieb:
Die PS4 Apu ist ein alter Jaguar. Soweit ich weiß müsste der Kaveri schneller sein.

Und genau da ist der Fehler.
Schleife 100x Lebenspunkte +1 bei Ausgangswert 0 = 100 Lebenspunkte
100x Lebenspunkte + 1 bei Ausgangswert 0 ohne Schleife = 100 x 1 Lebenspunkt
Das sind, wenn man sie zusammenführt zwar auch 100 Lebenspunkte. Aber was passiert, wenn du beim hochzählen angegriffen wirst?

Du musst diese parallelen Aufgaben als Subthreads sehen. Du hast eine Variable "lebenspunkte = 0". Bei jedem Schleifendurchlauf wird dieser um 1 erhöht, bis er 100 hat. Brichst du dies aber auf und verteilst diesen Vorgang auf 100 verschiedene Recheneinheiten, arbeitet jede einzelne mit dem Basiswert 0. Jede Recheneinheit rechnet aber nur einen einzigen dazu. Also kommt bei jeder Einheit das Ergebnis 1 raus. Und nun? Willste die Ergebnisse mit einer Schleife einfangen und dann noch einmal drauf addieren?

Genauso ist es mit der Änderung einer Variable zur Laufzeit. Du wist angegriffen und verlierst Lebenspunkte. Das geht, indem du eine entsprechende Abfrage in die Schleife setzt oder Threadunsafe programmierst. Welche der 100 Recheneinheiten kann sich dann auf die neue Situation anpassen?

Nein das hat nicht direkt was mit Threading zu tun. Ich habe ja auch 100 Einheiten die jeweils 1hp dazu bekommen, da ist keine Abhängigkeit zwischen den Einheiten.
Angenommen in Thread 1 steht eine Schleife mit 100 Durchläufen an. HSA würde erkennen ich kann die Durchläufe parallel ausführen. Erst wenn alle einzelnen Berechnung fertig sind geht es im Thread 1 weiter. Ist eigentlich als würde ich 100 Threads Software-Seitig erstellen und erst weiter fortfahren wenn alle Threads beendet sind.

TroaX · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

eiven schrieb:
Nein das hat nicht direkt was mit Threading zu tun. Ich habe ja auch 100 Einheiten die jeweils 1hp dazu bekommen, da ist keine Abhängigkeit zwischen den Einheiten.
Angenommen in Thread 1 steht eine Schleife mit 100 Durchläufen an. HSA würde erkennen ich kann die Durchläufe parallel ausführen. Erst wenn alle einzelnen Berechnung fertig sind geht es im Thread 1 weiter. Ist eigentlich als würde ich 100 Threads Software-Seitig erstellen und erst weiter fortfahren wenn alle Threads beendet sind.

Was willst du denn genau machen? 100 Einheiten + 1 Rechnen oder einer Einheit 100 mal + 1 Rechnen. Das ist schon ein unterschied. Das erste wäre das Sandwichbeispiel. Du willst mit 100 unterschiedlichen Parametern mit gleichem oder unterschiedlichem Wert das selbe machen. Der Wert jedes einzelnen Parameters ist für die Recheneinheit (<- Ich nenne es mal so, da du den Begriff Thread nicht mags, obwohl es der Logik entsprechend einer ist) der Ausgangspunkt, auf denen die Operationen durchgeführt werden. Das funktioniert aber nur, wenn eben jeder Parameter vom Grund auf unabhängig von einander ist und diese Vorgänge safe sind und nicht im nachhinnein während der Berechnung Änderungen der Operanten erwarten. Letzteres wäre, im Falle einer Aufteilung innerhalb der Schleife, abhängig. Der Parameter hätte immer den selben Wert und wenn genau das gleiche passiert, kommt auch genau das gleiche hinten raus.

Das bedeutet also, das eine Anwendung, bevor sie ausgeführt wird, ersteinmal darauf geprüft werden muss, welche Vorgänge nun eine eigene Einheit verwenden können:
1. Sie müssen unabhängig sein
2. Sie dürfen während der Laufzeit keinen Änderungen unterliegen
3. Die Subthreads (<- So nenne ich sie mal) müssen identifizierbar sein, wodurch Punkt 2 nicht mehr so ins Gewicht fallen würde, wobei aber Abstürze oder Fehlberechnungen dadurch an Bedeutung gewinnen
4. Muss natürlich der Sinn für eine Berechnung durch eine GPU-Einheit gesucht werden

Nur gerade bei Spielen: Wo gibt es wirklich Unabhängigkeiten? Vielleicht bei den Positionsberechnungen von Objekten, die nicht mit der Handlung interagieren oder gescriptet sind. Und vor allem, wenn man die GPU für diese Fälle zum rechnen nutzt, was berechnet dann die Grafik?

Wenn man nach den Kriterien seine Software selber schreibt und die Berechnungen per OpenCL oder CUDA an die GFX weiterträgt, ist das schon eine mords Arbeit. Wie soll das dann aber die APU selbst bewerkstelligen und vor allem entscheiden?

PCGH_Torsten · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

JackA$$ schrieb:
(sollte eigentlich nicht die APU von der PS4 nicht auch ähnlich für den PC erscheinen, der 7850k wird ja nicht an PS4 Niveau kommen?)

Es gab den Wunsch zahlreicher Anweder für eine Desktop-Variante, aber keine bestätigten Pläne AMDs. Aufgrund der anderen Schnittstellen passt die PS4-APU in keine bestehende Desktopplattform. Für PS4-Leistung ist GDDR5-Speicher nötig, den es nicht als Modul gibt. AMD könnte die komplette PS4-Platine mit PC-typischen Steckkontakten und einem Windows-kompatiblen UEFI anbieten. Aber würde das wirklich jemand kaufen? Die PS4 selbst ist, ohne Windows-Overhead, deutlich schneller. Herkömmliche PCs sind flexibler und aufrüstbar. Mit entsprechend dimensionierter Hardware ebenfalls schneller.

eiven schrieb:
Angenommen in Thread 1 steht eine Schleife mit 100 Durchläufen an. HSA würde erkennen ich kann die Durchläufe parallel ausführen.

Viele Schleifen beginnen nicht mit "tue 100 mal X", sondern mit "tue X bis A". Bedingung A mag dann nach 100 Durchläufen erfüllt sein, aber insbesondere in einem Spiel ist das nur schwer vorhersehbar. Sind nur 10 Einheiten aktiv, ist die gleiche Schleife schon nach 10 Durchläufen erledigt. Die große Kunst der Multi-Thread-Optimierung besteht darin, für derartige Vorhersagen weniger Zeit und Energie zu benötigen, als durch die paralelle Verarbeitung eingespart wird.

TroaX · 26. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

PCGH_Torsten schrieb:
Viele Schleifen beginnen nicht mit "tue 100 mal X", sondern mit "tue X bis A". Bedingung A mag dann nach 100 Durchläufen erfüllt sein, aber insbesondere in einem Spiel ist das nur schwer vorhersehbar. Sind nur 10 Einheiten aktiv, ist die gleiche Schleife schon nach 10 Durchläufen erledigt. Die große Kunst der Multi-Thread-Optimierung besteht darin, für derartige Vorhersagen weniger Zeit und Energie zu benötigen, als durch die paralelle Verarbeitung eingespart wird.

Genau da liegt an der Sache nämlich das Hauptproblem. Wenn müsste das ganze schon im Compiler selektiert und markiert werden, was am Ende durch die GPU-Einheiten gejagt werden kann und was nicht. Schleifen haben auch nicht immer den selben Aufbau. Zum Beispiel (wie schon beschrieben) würde "tue X mit Y bis A" da schon wieder zu einem Problem führen. Die gesamte Schleife kann in diesem Falle garnicht in einzelne Operationen unterteilt werden. Und in Spielen würde es eh nur Sinn machen, wenn eine weitere diskrete GPU am Board wäre. So könnten die GPU-Einheiten der APU dann zum Beispiel Positionen etc. berechnen, während die GPU das macht, wozu sie da ist. Wenn AMD HSA tatsächlich so hinbekommen würde, dann kann das schon einen ordentlichen Boost bringen. Allerdings ist eben die Selektierung, was machbar ist und was nicht die Schwierigkeit. Denn wenn sie Pech haben, sind sie wieder auf eine Implementierung seitens der Entwickler angewiesen.

TheLukay · 28. September 2014

AW: AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Ich glaube, wenn DDR4 preislich auf DDR3 Niveau kommt, wird es Zeit für APU-Sockel mit DDR4.

AMD erklärt den Vorteil von APUs: Mehr Sandwiches in kürzerer Zeit!

Pu244

Kokü-Junkie (m/w)

Gamer090

PCGH-Community-Veteran(in)

PCGH_Torsten

Community Manager

JackA

Lötkolbengott/-göttin

PCTom

Volt-Modder(in)

Shirozen

Guest

TroaX

Guest

Pu244

Kokü-Junkie (m/w)

TroaX

Guest

eiven

Kabelverknoter(in)

TroaX

Guest

PCGH_Torsten

Community Manager

TroaX

Guest

TheLukay

PC-Selbstbauer(in)

Ähnliche Themen