@Locuza: Was hältst Du eigentlich davon, wie einfach wäre es für Nvidia zu machen den GK104 praktisch aufzubohren auf eine Chipfläche so groß wie GK110, ohne dessen andere, für Gaming unnötige Funktionen zu übernehmen. Vielleicht haben sie sich ja dazu entschieden aus der jetzigen Fertigungstechnik praktisch auch im Gaming Bereich alles rauszuholen. (Oder sie denken die Leistung braucht eh keiner bis Ende 13, bis die neuen Konsolen kommen). Ich meine so ein Chip ist ja in einigen Teilen recht modular, das könnte doch möglich sein. Ob es schnell umsetzbar ist, bis Anfang 2013, ist wieder eine andere Geschichte.
Ich halte das für Quatsch. Auch wenn es modular aufgebaut ist und natürlich vieles dadurch eine C&P-Sache geworden ist, so muss man dennoch validieren, Testsamples abwarten usw.
Wie soll ein Gk104+ denn aussehen? Der GK110 wird wohl um die 550mm² groß sein und hat schon 2.880 Shader.
Man muss nur kurz über über den Kosten/Nutzen-Faktor drüber gehen und wird erkennen, dass so etwas kein gutes Finanzmanagement wäre. Ich brauche eine eigenständige Maske ( die noch verdammt groß und teuer ist), ich muss den Chip wieder anders designen, ich muss wieder ein gutes Verhältnis der Einheiten und der Spannung untereinander ausrechnen usw., um was zu erreichen? Einen monströsen, über 3.000 Shader-Koloss auf den Kunden loslassen, um potentiell wohl 5% der Consumer anzusprechen?
Wie viel sollte ich dann dafür verlangen? Über 1.000 Euro werden es mindestens sein.
Das ist Quatsch. Entweder kommt der GK110 auch auf den Retail-Market und wird bei den DP-Units beschnitten und beim verfügbaren GDDR5-Ram, um einfach soviel wie möglich quer zu subventionieren oder sie lassen es und belassen es bei einem kleinem Update à la GK 114. Wobei mit einem 256-Bit SI kommt man allerdings nicht mehr weit.
Nvidia wird ganz sicher die Smarter-Choice wählen und einen günstigen GK114 nachschieben, der auf jeden Fall unter 450mm² bleiben wird und vielleicht den GK110 auch auf den Consumer-Markt werfen.
es wird immer zahlen von 50% bis 90% herumgeschmissen vor release und am ende können wir froh sein,
wenn die gtx 780 30% schneller agiert wie die gtx 680. immer diese gerüchte: GK110 monster chip für gaming.
Die Daten lassen bisher auch nichts anderes zu, außer der Speicher und der Core ist über 30% geringer getaktet.
Wenn ich davon ausgehe, dass der Chip mit 800-900 getaktet ist, dann kommt dennoch eine um die 60% höhere Shaderperformance auf das Blatt Papier.
Der Speicher kann statt mit 3.000 von mir aus mit 2400-2800 getaktet sein, dann hast du dennoch eine um mindestens 25% höhere Bandbreite. Du hast pro Thread 255 Register statt 63 und doppelt so viel L2-Cache.
Bei Compute wird auf jeden Fall gemetzelt.
Diese 30% sind keine Freude, sondern ein Minimum.
Edit:
Wo skaliert SuperTiling oder SLI denn schlecht? Alles eine Frage von Interconnect, Treiber und Engine, wenn der Interconnect gegeben wäre und Treiber und Engines/Spiele so gut auf SuperTiling optimiert wären wie sie es heute auf AFR sind sehe ich keine großen Probleme.
Bei Supertiling hast du keine einwandfreie Skalierung. Du bräuchtest, wie du schon selber erwähnt hast, fette Interconnects, um die Daten zwischen den GPUs schnell genug austauschen zu können, einen gemeinsamen Memory Pool, um die Daten weiterhin verwenden zu können. Supertiling skaliert nach meinem Stand nicht bei den Geometrie-Daten und hat Probleme bei Texturen, die über die Tiles herausragen, weswegen die Texturen auch für das benachbarte tile berechnet werden müssen.
Wenn das mit einem möglichen Aufwand gelöst werden könnte, dann wäre das ja schön, aber die Hersteller haben sich ja schon Jahrelang davor gedrückt bei AFR bessere Puffer und Frameratenausgaben zu implantieren.
Ich auch... aber was nicht ist kann man ja übertakten, spätestens unter Wasser, in aufgebohrten drölf Phasen-ololol OC Editions
Wenn wir die Papiertiger vergleichen, wozu sollten wir dann überhaupt OC-Möglichkeiten mit einschließen?
Außerdem waren da die Treiber wohl noch nicht ganz ausgereift und Single GPU FPS ungleich Dual GPU FPS...
Es gibt auch ein schönes Gegenbeispiel: die GTX 280 befindet sich etwa auf dem selben Niveau wie die 9800 GX2- obwohl sie deutlich weniger Rohleistung hat, auch hier haben wir jeweils eine sehr ähnliche Architektur.
In wie fern deutlich weniger Rohleistung? Die Pixelfüllrate war gleich, die Texelfüllrate viel geringer, die Speicherbandbreite war etwas höher und man hatte 1x 1Gb anstatt 2x512Mb, welcher der GX2 schon damals oft in den Magen gehauen hat. Dazu kamen mehr Register, Local-Memory, effizientere TMUs und aufgebohrte ROPs. Das ist glaube ich insgesamt mehr Veränderung als zwischen einer HD 4870x2 und einer HD 5870

Ich wollte auch nur einen Vergleich bei der Skalierung starten, nicht darüber debattieren, wie "gut" S-GPU FPS sind und wie gut D-GPUs.
Mehr Auflösung schafft nicht mehr Polygone...
Mit mehr Auflösung und mehr AA werden v.A. VRAM und ROPs immer stärker ausgelastet bis sie limitieren und der restliche Chip nichtmehr die volle Leistung bringen kann. Moderne High-End GPUs sind vor allem bei Spielen mit älteren Engines und hohen AA Modi oder Auflösungen meist nicht optimal ausgelastet.
Sorry, ich meinte mehr Pixel pro Polygon
Und ich habe hier auch nicht über die optimale Auslastung geredet, sondern bin über deine Formulierung gestolpert. Du hast eine "komplexe Architektur", als sub-optimale Lösung bei BQ-Modis eingeworfen.
Was irgendwie gegen eine Logik stößt, da die Skalierung beibehalten wurde und der Abstand mit größer sein wird, als ohne, weswegen ein GK110 das alles wohl effizienter abarbeiten würde.