Sorry, aber das ist einfach falsch...
Mali-T622 - ARM
Die neueren Mali GPUs bieten OpenCL 1.1 Support. Ob auch OpenCL 1.2 aktuell unterstützt wird weiß ich nicht, wird aber sicherlich bald kommen.
Und damit nicht genug, es gibt auch Mali mit DX11 Support, und damit DirectCompute.....
Wenn ich eine PowerVR-GPU in mein SoC integriere, dann bringt mir das: Grafikausgabe. Sonst nichts.
Sorry, aber auch DAS ist einfach falsch...
PowerVR? Series6 IP Core
Alle SGX Series 6 GPUs von PowerVR unterstützen OpenCL 1.x
Dazu kommt noch DX10 Support, und damit soweit ich das weiß auch eben support von DirectCompute
Wenn ich ein custom-SoC bei AMD kaufe, dann bringt mir das: (ne CPU & ) Grafikausgabe und sonst nichts.
Falsch, du hast auch Support für DirectCompute und OpenCL. Zudem für HSA bei den neueren Semi-Custom-APUs, die du dir besorgen kannst.
Zudem wirst du den Zugriff auf die Freedom-Fabric erhalten, die wie es scheint doch ziemlich brauchbar ist.
Ganz zu schweigen von so Nebenkriegsschauplätzen wie:
- PCI-E 3.0 Controller mit Rootcomplex
- SATA 2/3 Controller
- USB 2/3 Controller
- NIC ist meines Wissens bei denen auch integriert, wird aber meist nicht genutzt. Zumindest ist es so bei den Chipsätzen für AM3(+)
- Eventuell auch Raidsupport, da bein ich mir aber nicht sicher, kann aber sicherlich als Option zugekauft werden
Sorry, aber der EINZIGE, der NICHTS aber auch wirklich GAR NICHTS! außer Grafik im SFF/Mobile Markt bietet außer Grafikausgabe ist nVidia.... Die haben den "Trend" völlig! verschlafen. Die hinken da unglaublich weit zurück. Sorry, aber was du da gerade geschrieben hast ist totaler Stuss. nVidia ist in dem Markt einfach nur schlecht was das Featureset anbelangt. Deswegen verkaufen sich wohl ihre Tegras auch so schlecht.
Wenn ich aber eine aktuelle Nvidia-GPU in mein SoC integriere, habe ich neben dem Rendering noch eine deutliche CPU Entlastung in einer Vielzahl bestehender, populärer PC, X360 und PS3 Titel.
Nein hast du nicht....
Soll ich dir auch sagen warum?
Du kannst weder die PC noch die X360 geschweige denn die PS3 Titel starten.... X360 und PS3 sollten klar sein, das sind propritäre Konsolen, ich frag mich, wie du da berhaupt darauf kommst
Und PC geht auch nicht, weil du eben in keinen SOC eine nVidia GPU integrieren kannst, die x86 Code ausführen kann, außer VIA nimmt sich dessen an, aber wie war das mit der "zu geringen CPU Leistung von AMD"?
VIA ist in einem KOMPLETT! anderen Markt unterwegs als Intel und AMD. Das kannste total knicken...
Sorry, aber das sind gerade echt nur Nebelkerzen. Ohne MINDESTENS! Neucompilieren, kannste da gar nichts reisen. Am Ende wirst du aber sogar große Anpassungen durchführen müssen, da du eben die Software auf ARM/MIPS/PowerPC/SPARCE portieren müsstest....
Und das wird KEINER! machen, und selbst WENN, dann hättest du noch immer ein riesen Problem... Die Software, die du dir vorstellst/nennst, läuft unter Windows... Viel Spaß mit ARM/MIPS/PowerPC/SPARCE und Windows......
Also gerade auch Spielen, deren Leistungsanforderungen in dem Bereich liegen, in dem in 1-3 Jahren (="1 Entwicklungszyklus") Tablets zu erwarten sind. Und das ohne irgend eine Änderung an der Physik-Engine vornehmen zu müssen.
Nein... Da Software inkompatibel...
PCI-E und RAM sind externe Schnittstellen. Die unterzubringen erfordert natürlich etwas Planung, sonst kommst du an deine I/O Pads überhaupt nicht angemessen ran. Eine iGPU dagegen muss (fast) "nur" mit *was auch immer du in deiner CPU an Interconnect nutzt* (Crossbar, Ringbus, ggf. PCIe selbst, wenns ein einfaches Design wird?) verbunden werden.
Ja, du musst das an die internen Strukturen anpassen, dazu musst du aber die Interfaces an der richtigen Stelle haben, und überhaupt erstmal kompatible Schnittstellen haben, die dir nicht Leistung und Latenzen OHNE! Ende fressen....
Sicherlich ist das nicht leicht, aber es ist ein Funktionselement, dass sich seinerseits an Bedürfnisse anpassen lässt - wesentlich freier als z.B. ein RAM-Controller, der nun einmal zwingend an einer Außenkante liegen sollte, weil er viele Anbindungen braucht.
Nein, es ist nicht einfacher, weil du ja einen gemeinsammen Adressraum haben willst, ansonsten ist das Ding nicht Konkurrenzfähig gegen die AMD/HSA Lösungen der Konkurrenz, die in absehbarer Zeit kommen werden.
Und bezüglich der Anordnung und "kleiner" und "großer" Chipkomponenten: Llano hat die GPU als Block in einer Hälfte. Trinitiy hat die GPU als Block in einer Hälfte. Sandy Bridge hat die GPU als Block in einer Hälfte. Ivy Bridge hat die ... . Haswell hat ... . Kal El hat ... . Wayne ... .
Dir ist schon klar, dass das jeweils eine Vielzahl wiederum kleine IP-Block ist, die z.B. SRAM, ALUs, Branchprediktion usw ist. Das erkennst du dann auch mit dem Auge. Sprich, alles was klare Strukturen hat ist im Normalfall von Hand entworfen, gelayoutet und geroutet. Das ist aber nur ein Teil eines Chips. Die gesamte Verbindung dieser kleineren IP-Block erfolgt aber normal mittels tools heutzutage. Und da sprechen wir von CPUs un I/O Blocks....
Wir müssen aber über GPUs! sprechen, wo die Sache FUNDAMENTAL! anders aussieht. Hier wird fast alles syntethisiert... Deswegen erkennt man auf GPUs auch fast keine klaren Strukturen, weil eben fast alles durch Tools gejagt wird....
Und selbst bei den Sachen, die so tool klar strukturiert aussehen, hast du dazwischen immer mehr oder weniger große Areale, die auch wieder syntethisiert sind. Und da steckt eben auch oft noch sehr sehr viel Logik drin. Gerade bei GPUs ist es so, weil man Durchsatzoptimierte Designs hat. Das würdest du von Hand gebaut gar nicht so hinbekommen... Da gehen die einzelnen Funktionsblöcke auch fließend ineinander über. Schau dir mal ein Blockschaltbild/Floorplan eines Jaguar-Cores an.... Da siehst du mal ansatzweise, wie stark die einzelnen Bereiche ineinander übergehen...
Ich gebe zu, dass ich mir Insiderwissen klar fehlt. Aber wenn jedes einzelne full custom Design (alias "für uns selbst") mit nenenswerter iGPU diese als einen großen, in sich geschlossenen Block positioniert, dann frage ich mich doch, warum das bei einem semi-custom auf einmal unmöglich sein sollte.
Genau das ist eben das Problem...
Das sieht für den Laien so aus, weil er eben nur mit den Augen das sieht. Wenn du aber dich damit beschäftigst, dann wird dir mit der Zeit klar, dass das eben weit weg von der Realität ist, was man so als Laie denkt. Die ganzen Sachen sind VIEL komplizierter als man denkt, und der Wahnsinn/Teufel steckt im Detail... Man sieht die meisten komplexen Sachen einfach gar nicht, weil Sie eben nur als Graue-Masse erscheinen, da synthetisiert...
Es gibt Firmen, die fertige IP-Blocks anbieten, und das doch so manche die eben geschlossene IP-Blocks verkaufen, also den Quellcode NICHT bekommst. Da bist du aber auf EXTREM! viel und guten Service/Support angewiesen. Wenn der fehlt, rennste dir als Firma schnell den Kopf ein, weil du IMMER! auf Probleme stößt, die es zu klären gibt. Daher ist das IP-Geschäft auch kein einfaches. Es bedarf da eines großen Vertrauens. Du musst ja bedenken, dass da Multimillionen $ Investitionen getätigt werden, die schnell in den Sand gesetzt werden können.
Wir hatten es heute erst im Meeting. Da hat unser Chef gesagt, dass im IP-Bereich leider viel zu viele Verbrecher/Betrüger rum rennen, und man aufpassen muss wie noch was, das man auch wirklich das bekommt, was man erwartet...
So manche Firma versucht dir nämlich Produkte an zu drehen, die noch gar nicht fertig sind.... Und dann passiert es auf einmal, das du x Monate delay hast, weil dein Zulieferer nicht mit seinem IP-Block fertig wird. Oder die Spezifikationen der Schnittstellen ändern sich, oder oder oder oder....
Du brauchst da einfach VERDAMMT verlässliche Partner, und sorry, nVidia steht NICHT gerade dafür ein verlässlicher Partner zu sein... Die letzten Jahre glänzt nVidia eigentlich nur mit einem: Verschiebungen, und revidieren von Roadmaps usw....
Sorry, aber als Chef einer Firma würde ich wohl als letztes an nVidia denken, wenn es um IP-Blöcke geht. Wenn dann nur mit abartig krassen Konventionalstrafen. Aber selbst dann hätte ich noch Angst, das nVidia Probleme macht. Vor allem, als IP-Nehmer muss ich ja nicht nur mit normalen Delays klar kommen, nein, wenn der IP-Anbieter meint, er müsse schnittstellen oder LAyouts oder oder oder ändern, dann biste der gearschte, weil du je nachdem nochmal komplett von vorne anfangen kannst, dein Package, dein LAyout und Routing zu machen... NA GZ sag ich dir da... Da willste alles, nur nicht mit ner Firma zusammenarbeiten, die schon ihre eigenen Roadmaps immer und immer wieder grandios in den Sand setzt...
Sowohl Nvidia als auch AMD leisten es sich nicht einmal ein zweites Stepping des Transistorlayers. Entweder sind das also gnadenlos begabte Hellseher, die alles, wirklich alles im vorraus planen können (im Gegensatz zu z.B. den Loosern bei Intel, die manchmal 3-4 Versuche brauchen), oder da kann nicht alzuviel Entwicklung drin stecken, die nicht zu 99% von TSMC übernommen wurde...
Dir ist schon klar, das AMD und nVidia über viele viele Jahre ihre Bibliotheken haben reifen lassen, genau wie ihre Tools. Allein von einem Tool auf ein anderes um zu steigen kann dich Wochen/Monate an Entwicklungszeit kosten....
nVidia und AMD sind teilweise weit weg von dem, was du als "0815" TSMC Kunde bekommst. Die überziehen die Designrules von TSMC, einfach weil Sie ihre eigenen Entwicklungen mit einbringen, und genau deswegen stehen Sie auch da wo Sie heute sind. An der Spitze.
Und ja: TSMC bietet einem ein paar Möglichkeiten. Was spricht dagegen, die zu nehmen, für die man ein fertig optimiertes Design kaufen kann?
Ein paar?
Du meinst wohl eher hunderte....
Das größte Problem von Tegra ist, dass er eine zu eingeschränkte CPU-Konfiguration hat (siehe den nachgeschobenen i), um einen größeren Marktbereich abzudecken, und dass die Entwicklungskosten für diese auch noch in keinem Verhältnis zum Ergebnis stehen, weil Nvidia eben keine Ahnung von CPUs hat. Beide Probleme lösen sich in Luft auf, wenn man die Konzeption von CPUs Leuten überlässt, die sich mit sowas auskennen.
Und zum Minusgeschäft: Wenn man (quasi) keine Investitionen hat, kann man auch keine Verluste machen. Die Entwicklung der Grafikeinheiten als solche ist für Nvidia quasi umsonst, denn die sollten ab der nächsten Generation sowieso runterskalierte Desktop-Architekturen sein. Man muss lediglich den Personalaufwand finanziert bekommen, der bei der technischen Unterstützung des Kunden anfällt (Implementation und ggf. Anpassung der Schnittstelle zur restlichen CPU). Sobald der Kunde 1 € mehr zahlt, als diese Techniker kosten, macht Nvidia Gewinn.
Und selbst wenn er nur ±0 diese Kosten zahlt, ist die Sache für Nvidia lohnend. Denn so erhält man mehr Aufmerksamkeit, ist für Entwickler attraktiver (bzw. "produziert" umgekehrt mehr Entwickler, die sich schon mit der Architektur auskennen) und vor allem: Verbreitet CUDA. Und im Gegesatz zu AMD und Intel mit ihren ultra mobilen Ambitionen riskiert Nvidia mit kleineren iGPUs keine Eigenkonkurrenz zu bestehenden Produkten. Es ist schlichtweg ein Markt, auf dem man -abseits des wohl gefloppten Tegra- nicht präsent ist und den man nun versucht, von Lizenznummern zum Nulltarif (bzw. Plustarif) erobern zu lassen.
Du hast nicht mal den Ansatz einer Vorstellung davon, welcher Aufwand es für nVidia mit derartigen spezialisierten Designs den IP-Markt zu betreten. Den Support den die Leisten müssen ist extrem, und die Leute wachsen nicht auf Bäumen... Selbst mit allem Geld der Welt bekommst du nur schwer Leute mit dem entsprechenden Know-How .....
Support von IP-Nehmern bedeutet also zwangsläufig weniger Leute in der Entwicklung eigener Produkte.... Und du kannst gift darauf nehmen, dass das wie der Hüten eines Sackes voller Läuse ist....