GeForce GTX 780 soll nicht auf GK110-Chip basieren

Der Multi GPU Markt ist aber zu klein um spezielle Multi GPU Chips zu entwickeln und zu bauen; also gibt es bis in absehbare Zukunft AFR mit allen damit verbundenen Nachteilen. Und so lange es AFR gibt ist Multi GPU meiner Meinung nach eine unschöne Notlösung, die dort genutzt werden sollte, wo die schnellste verfügbare Single GPU Lösung nichtmerhr ausreicht.

Ja das eben ist das Problem. Ich denke mal wenn Nvidia oder AMD wirklich wollten könnten sie einen Chip bauen der für MGPU bestens geeignet ist, wie es der VSA100 von 3dfx damals auch war. Aber warum sollten sie das wollen? Im Rendering gibt es dafür keine Notwendigkeit, der VSA 100 war ja eigentlich auch nur eine unschöne Notlösung. Dort wo MGPU Sinn macht, gibt es solche Probleme wie "Mikroruckeln" nicht. Meine Grafikkarten habe ich früher gern fürs Folding genutzt bei unserem Team, und DA haben die beiden die DOPPELTE Leistung gegenüber einer einzigen Karte gebracht. :)

Edit: Wenn die Spiele- Grafik und Physik so fortschreiten würde, das Nvidia und AMD nicht mehr hinterherkommen würden um die Ansprüche zu erfüllen, könnten sie gezwungen werden die MGPU Technik zu verbessern. Da dies aber offenbar nicht so ist, brauchen sie das auch nicht zu tun.
 
Zuletzt bearbeitet:
Wobei der GK110 durch seinen komplexen Aufbau mit hohen Auflösungen und AA vermutlich recht ineffizient arbeitet.

Die wahren Stärken des GK110 sind wohl Raytracing und Voxel Berechnungen sowie komplexe Physikberechnungen, dafür sollte er erheblich besser geeignet sein als jeder GPU vor ihm (mit Ausnahme von Larrabee und Nachfolgern)- nur leider wird dieses Potential von keiner aktuellen oder absehbar zukünftigen Spieleengine genutzt.
 
Quelle?
Nochmal:
Im Vergleich zu dem GK104 hat der GK110 eine 87,5% größere Rohleistung und ein 50% breiteres Speicherinterface. In Anwendungen, die halbwegs skalieren sollte er -bei gleichem Takt- zwischen 50% und knapp 90% schneller sein.
Abhängig davon woher du die "30%" hast kann es natürlich sein, dass eine Teildeaktivierung und/oder ein geringerer Takt miteingerechnet wurde.

Nochmal: Es ist unrealistisch, dass der GK110 in Games 50-90% schneller wird als der GK104 der GTX680.
Ich hatte da mal einen umfangreicheren Bericht drüber gelesen. Ich weiß nicht mehr genau wo. Könnte beim 3-D Center gewesen sein.
Auch die GTX580 konnte sich nie in dem Maße von der 560 Ti absetzen, wie es die reinen Zahlen auf dem Papier vermuten ließen.
Der GK110 mag ein Compute-Monster werden, aber er ist nicht als Gaming-Monster konzipiert.

Ach ja, wie wäre es denn, wenn du mal für deine 50-90% in Spielen DEINE Quellen nennst? :schief:
 
Zuletzt bearbeitet:
Ja das eben ist das Problem. Ich denke mal wenn Nvidia oder AMD wirklich wollten könnten sie einen Chip bauen der für MGPU bestens geeignet ist, wie es der VSA100 von 3dfx damals auch war. Aber warum sollten sie das wollen? Im Rendering gibt es dafür keine Notwendigkeit, der VSA 100 war ja eigentlich auch nur eine unschöne Notlösung. Dort wo MGPU Sinn macht, gibt es solche Probleme wie "Mikroruckeln" nicht. Meine Grafikkarten habe ich früher gern fürs Folding genutzt bei unserem Team, und DA haben die beiden die DOPPELTE Leistung gegenüber einer einzigen Karte gebracht. :)

Edit: Wenn die Spiele- Grafik und Physik so fortschreiten würde, das Nvidia und AMD nicht mehr hinterherkommen würden um die Ansprüche zu erfüllen, könnten sie gezwungen werden die MGPU Technik zu verbessern. Da dies aber offenbar nicht so ist, brauchen sie das auch nicht zu tun.


Es ist ziemlich egal, wie sich die Spieletechnik weiterentwickelt. Es wird NIE sinnvoll sein, eine spezielle Multi-GPU zu entwickeln, das geht allein aus dem Grundgedanken hervor. Der VSA100 wurde auch nicht im geringsten speziell für Multi-GPU entwickelt. Es war beim damaligen, beschränkten Funktionsumfang nur verdammt einfach einen non-multi-GPU-Chip multi-GPU tauglich zu machen. Eigentlich beschränkte es sich auf die Verteilung von Renderzeilen, selbst die Anbindung basierte ja schon auf einem fertigen BUS. Heutzutage dagegen haben beide Hersteller schon extra interconnects geschaffen, müssen komplexe Datenaustausch- und Verteilungssysteme beherrschen, die Chips zeitlich koordinieren (Mikroruckeln mal außen vor - es gibt auch Effekte, die auf Informationen aus dem letzten Frame zugreifen und das Wissen über den muss erstmal im richtigen Moment am richtigen Ort sein), etc. .
Würde der Multi-GPU-Aufwand aber soweit steigen, dass man einen zusätzlichen Chip dafür entwickeln muss, würde er sinnlos werden. Denn dann kann man auch gleich einen weiteren zusätzlichen Chip oberhalb des bestehenden Portfolios entwickeln und auch diese Leistungsklasse mittels Single-GPU abdecken. Multi-GPU macht nur dann Sinn, wenn man mit relativ wenig Aufwand GPUs, die man ohnehin fertigt, auch für die Abdeckung eines höheren Leistungsspektrums nutzen kann, um sich eben die Entwicklung eines weiteren Chips dafür zu sparen.
 
Auch die GTX580 konnte sich nie in dem Maße von der 560 Ti absetzen, wie es die reinen Zahlen auf dem Papier vermuten ließen.
Der GK110 mag ein Compute-Monster werden, aber er ist nicht als Gaming-Monster konzipiert.

Ja richtig. Man erinnere sich auch mal an GTX480 vs. GTX 460. Der GF100 war ja als ineffizient verschrien, alle sagten der Fokus lag bei dem Ding zu sehr auf GPGPU. Die 460 wurde dann gelobt wegen ihrer Effizienz, dank Gaming Fokus. "Fermi done right" ;)

Bei der Gelegenheit fällt mir nochwas ein: Wäre es nicht möglich die Pro und Consumer Line zu trennen? Praktisch einen auf 15 SMX aufgebohrten GK104 zu machen und den GK110 nur als Tesla oder in Großrechnern zu verwenden? So laienhaft stelle ich mir das grad vor. :)

Edit: @Ruyven: War auch nur ein Gedankenspiel. Aber es stimmt natürlich das es sinnlos wäre, aus betriebswirtschaftlicher Sicht sowieso. Ich wollte auch nur sagen: Wenn sie wollten, könnten sie. Auch wenns ein Flop wäre. Und das mit den Effekten hab ich ja vorher auch schon erwähnt hier in einem Post dieses Threads. AFR ist halt einfach für ein paar Enthusiasten gedacht. Nvidia und AMD haben einfach eine günstige Möglichkeit gesucht dieser Spezies mehr Grafikkarten zu verkaufen. :)

Edit2: Noch eine Frage an Dich: Was wäre denn nun bspw. wenn die Hersteller den kleinst möglichen Fertigungsprozess erreicht hätten und die Leistung dann immer noch nicht ausreicht? Wäre dann die Entwicklung eines speziellen MGPU Chips sinnvoll? Denn dann kann ich ja nicht einfach noch einen obendrauf setzen beim nächsten Shrink.
 
Zuletzt bearbeitet:
PS: Fermi war nicht halbfertig. Grundsätzlich ist Fermi genial, nur hat er sich als deutlich stromhungriger und hitzköpfiger herausgestellt, als geplant. Deshalb wurden die Taktraten gesenkt. Aber bevor man alles über den Haufen wirft und ne Menge an Geld und Kunden verliert, wirft man den Chip lieber so auf den Markt.
Fermi war fehlerhaft, deswegen hatte er schlechte Yields und war sehr stromhungrig. Laut Nvidias CEO gab es ein Interconnect Problem zwischen den Shader-Clustern.

Allerdings ist der GF110 ein wirklich grossartiger Chip. Und ja die Fermi Architektur war und ist Klasse, allerdings weiss nur Nvidia warum sie jetzt eine Leicht andere Richtung einschlagen, möglicherweise zukünftige Features welche ein Anpassung der Arichitektur nötig machten?
Einen >500mm² Chip sollte man keinesfalls mehr zum Anfang einer neuen Node herausbringen. Yield und Features waren die Gründe für Nvidia BigK später raus zu bringen.


Was ist besser?
20% mehr FPS dafür 80% mehr Stromverbrauch (und damit idR. lautere Lüfter).
Ich bin froh das NV den "richtigen" Weg gegangen ist => weniger Stromverbrauch, einfacher zu kühlen und
etwas schneller Modelle. (GTX 580 vs GTX 680)
Ich hoffe die GTX 780 wird da weitermachen.
Zu Pauschal ausgedrückt. Wieso nicht gleich 1% mehr FPS und 300% mehr Stromverbrauch? Das Verhältnis muss nicht so schrecklich sein, wie du gerade darstellst ;)
Aber ich bevorzuge auch eher schlanke Lösungen.

Unter einer "sehr, sehr guten Multi-GPU Lösung" stelle ich mir eher eine Karte mit mehreren Chips vor, die über einen sehr breiten und latenzarben Interconnect, etwa einem aufgebohrtem HT-Link eng miteinander zusammenarbeiten und das Bild im SLI oder SuperTiling Modus -wenn nicht in einem völlig neuen Renderverfahren- gemeinsam berechnen.

30fps auf einer Single GPU Karte sind mir jedenfalls lieber als 40fps auf einer Multi-GPU Karte.
AFR ist die effizienteste und leichteste Multi-GPU-Lösung. Super-Tiling skaliert nicht über die Bank hinweg gut.
Das Beispiel mit 30 FPS auf S-GPU und 40 FPS M-GPU ist auch zu extrem gewählt. Geht man von einer durchschnittlichen Skalierung von 60-80% aus, dann hätte die M-GPU typischerweise eher 48-54 FPS.

Der GK104 hat 8 Shader Cluster, der GK110 im Vollausbau hat 15(!); damit hat er bei gleichem Takt eine Rohleistung, die nur wenig unter jener von zwei GK104 ist. Als Single GPU arbeitet er aber prinzipiell effizienter, damit ist eine Praxisleistung, die im Schnitt deutlich über einer GTX 690 liegt durchaus realistisch.

Man muss sich wirklich vor Augen führen, was für ein Monster der GK110 ist- es ist der vielleicht ambitionierteste, kompromissloseste High-End GPU aller Zeiten!

Ob der GK110 aber überhaupt im Vollausbau erscheinen wird, geschweige denn als GeForce ist natürlich keineswegs sicher.
Ich denke das "bei gleichem Takt" solltest du dick schreiben ;)
Ich zweifel 1 Ghz und mehr stark an.

Der Gk110 ist wirklich ein sehr ambitioniertes Projekt, aber die 280-Chips waren sogar über 600mm² groß. Also das war auch nicht ganz ohne für die Zeit.


Wobei der GK110 durch seinen komplexen Aufbau mit hohen Auflösungen und AA vermutlich recht ineffizient arbeitet.
In wie fern ist ein "komplexer Aufbau" hinderlich bei hohen Auflösungen und AA? Also was sollten die Gründe für "vermutlich recht ineffizient" sein?

Was mal ganz interessant ist: 4870 X2 vs. 5870. Wir erinnern uns, der 5870 ist ein doppelter 4870 mit 100 Mhz mehr Takt und wohl leichten internen Verbesserungen. Der Vergleich ist also sehr passend.
Test: ATi Radeon HD 5870 (Seite 23) - ComputerBase

Zu Anfang ist die X2 sogar auf dem gleichen Level gewesen, da mehr Bandbreite pro Chip und die Work-Distribution wohl besser funktioniert, wenn das pro Chip erledigt wird. Das alles bei geringerer Rohpower.
Neuere Benchmarks wären sehr interessant, aber das Beispiel zeigt, dass eine S-GPU auch bei gleicher Rohpower die M-GPU nicht "deutlich" schlagen kann.
In dem Beispiel gar nicht.
 
Zuletzt bearbeitet:
Nochmal: Es ist unrealistisch, dass der GK110 in Games 50-90% schneller wird als der GK104 der GTX680.
Ich hatte da mal einen umfangreicheren Bericht drüber gelesen. Ich weiß nicht mehr genau wo. Könnte beim 3-D Center gewesen sein.
Auch die GTX580 konnte sich nie in dem Maße von der 560 Ti absetzen, wie es die reinen Zahlen auf dem Papier vermuten ließen.
Der GK110 mag ein Compute-Monster werden, aber er ist nicht als Gaming-Monster konzipiert.

Der Unterschied zwischen GK110 und GK104 ist auch größer als der zwischen GF110 und GF114...

...außerdem ist die GTX 560Ti erheblich höher getaktet als die GTX 580

Dennoch ist die GTX 580 ~30% schneller. Da sollte klar sein, das man vom GK110 gegenüber dem GK104 mehr erwarten kann... zumindest wenn er im Vollausbau und mit gleichem Takt kommt.

Nochmal zur Erinnerung:

Der GF110 besitzt gegenüber dem GF114... 50% mehr ROPs... 50% mehr Shader ALUs... 100% mehr Shader Cluster... die selbe Anzahl an Textureinheiten... 50% mehr L2 Cache... ein 50% breiteres Speicherinterface

Der GK110 besitzt gegenüber dem GK104... 50% mehr ROPs... 87,5% mehr Shader ALUs... 87,5% mehr Shader Cluster... 87,5% mehr Textureinheiten... 150% mehr L2 Cache... ein 50% breiteres Speicherinterface

Abgesehen davon hat der GK110 natürlich noch weitere "Bonusfeatures", die aber zumindest in aktuellen Spieleengines (leider) wenig bringen, etwa mehr Register, mehr DP Leistung oder bessere Thread Verwaltung.

Ach ja, wie wäre es denn, wenn du mal für deine 50-90% in Spielen DEINE Quellen nennst? :schief:

Abschätzung der Rohleistung.

In wie fern ist ein "komplexer Aufbau" hinderlich bei hohen Auflösungen und AA? Also was sollten die Gründe für "vermutlich recht ineffizient" sein?

Hinderlich ist es nicht unbedingt... aber so bleiben eher Fähigkeiten ungenutzt.
 
Zuletzt bearbeitet:
Superwip schrieb:
..außerdem ist die GTX 560Ti erheblich höher getaktet als die GTX 580

Natürlich ist sie das. Aber auf dem Platz ist nun mal das was zählt. Der GK110 muss mit den finalen Taktraten in Benchmarks zeigen was er kann, nicht auf dem Papier und in Spekulationen, wie du es hier tust, denn das ist vollkommen unerheblich.

Superwip schrieb:
Abschätzung der Rohleistung.

Dann würde ich sagen, ist da bezogen auf die Spielleistung wohl eher der Wunsch der Vater des Gedankens. ;)
Zumal ja gar nicht klar ist, ob wir den GK110 überhaupt als Geforce sehen werden.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: geo
Die wahren Stärken des GK110 sind wohl Raytracing und Voxel Berechnungen sowie komplexe Physikberechnungen, dafür sollte er erheblich besser geeignet sein als jeder GPU vor ihm (mit Ausnahme von Larrabee und Nachfolgern)- nur leider wird dieses Potential von keiner aktuellen oder absehbar zukünftigen Spieleengine genutzt.

Du kannst dir ja dann eine GK110 Grafikkarte als Physx Beschleuniger mit einbauen. ;)
Ich vertraue lieber der GTX 790.
 
Hinderlich ist es nicht unbedingt... aber so bleiben eher Fähigkeiten ungenutzt.
Es ist gar nicht hinderlich, weil gerade bei höheren Auflösungen und einer höheren Sample-Anzahl mehr Polys, Work-Units etc. anstehen und die Einheiten besser ausgelastet werden können.
Im Vergleich zu den anderen GPUs werden höhere BQ-Modis immer zu einem größeren Abstand führen, als ohne, falls die Einheiten passend skaliert wurden, was ja wohl der Fall sein wird.


@Cook2211

Nvidia hat doch selber auf der GTC gesagt, dass wir GK110 im Spielemarkt 2013 erst erleben werden und Ende 2012 im Profi-Markt?
 
Zuletzt bearbeitet:
@Cook2211

Nvidia hat doch selber auf der GTC gesagt, dass wir GK110 im Spielemarkt 2013 erst erleben werden und Ende 2012 im Profi-Markt?

Den PCGH Artikel hier auf der Seite habe ich grad nochmal gelesen und mir kam dabei der Eindruck auf das Nvidia zu dem Thema nichts gesagt sondern der Autor des Artikels selbst spekuliert hat das GK110 erst 2013 im Consumer Markt veröffentlicht wird. Weiter steht drin dass "Nvidia sich es wohl nicht nehmen lassen wird das Prestigeobjekt GK110 als Geforce zu veröffentlichen", so sinngemäß zitiert. Also sicher ist hier gar nichts. :)

Edit: Hier das komplette Zitat.
Erste Produkte mit dem GK110 werden Tesla-K20-Karten gegen Ende des Jahre im vierten Quartal sein; in Sachen Geforce und Quadro hielt Nvidia sich noch bedeckt, diese werden aber nicht vor 2013 kommen - eine endgültige Entscheidung, wann und ob überhaupt der GK110 in diesen Märkten eingesetzt wird, sei noch nicht getroffen. Nichtsdestotrotz ist es natürlich wahrscheinlich, dass sich Nvidia den Prestigegewinn nicht entgehen lassen wird, eine GK110-Geforce herauszubringen.

http://www.pcgameshardware.de/Grafi...ils-aus-der-GTC-Session-Inside-Kepler-884253/
 
Zuletzt bearbeitet:
Den PCGH Artikel hier auf der Seite habe ich grad nochmal gelesen und mir kam dabei der Eindruck auf das Nvidia zu dem Thema nichts gesagt sondern der Autor des Artikels selbst spekuliert hat das GK110 erst 2013 im Consumer Markt veröffentlicht wird. Weiter steht drin dass "Nvidia sich es WOHL nicht nehmen lassen wird das Prestigeobjekt GK110 als Geforce zu veröffentlichen", so sinngemäß zitiert.
Das könnte natürlich sein, wobei ich das schon öfters gelesen habe. Es wäre schlimm, wenn das Nvidia nicht persönlich gesagt hat, weil ich hasse nichts mehr als Behauptungen, ohne diese als solche zu kennzeichnen.
Aber ne, eine HPC-Only-GPU Zweifel ich noch stark an.
 
So im Zusammenhang des kompletten Zitats mit dem was Nvidia damals gesagt hat, nämlich das eine Entscheidung GK110 Geforce, Ja oder Nein, damals noch nicht getroffen wurde und mit dem heutigen Gerücht könnte man jetzt annehmen das die Entscheidung eben jetzt gefallen ist. Gegen einen GK110 auf einer Geforce, was ja dann als High End Nachfolger die GTX 780 gewesen wäre.

@Locuza: Was hältst Du eigentlich davon, wie einfach wäre es für Nvidia zu machen den GK104 praktisch aufzubohren auf eine Chipfläche so groß wie GK110, ohne dessen andere, für Gaming unnötige Funktionen zu übernehmen. Vielleicht haben sie sich ja dazu entschieden aus der jetzigen Fertigungstechnik praktisch auch im Gaming Bereich alles rauszuholen. (Oder sie denken die Leistung braucht eh keiner bis Ende 13, bis die neuen Konsolen kommen). Ich meine so ein Chip ist ja in einigen Teilen recht modular, das könnte doch möglich sein. Ob es schnell umsetzbar ist, bis Anfang 2013, ist wieder eine andere Geschichte.
 
Also wenn man bedenkt das Nvidia mit der Performance Klasse eine AMD HighEnd Klasse die Stirn bieten kann, was wäre das mit dem GK110 geworden!
Nvidia wird sich gedacht haben, GK110 als Tesla, da bekommst noch gutes Geld für und den Core weiter optimieren für die nächste Generation!
 
es wird immer zahlen von 50% bis 90% herumgeschmissen vor release und am ende können wir froh sein,
wenn die gtx 780 30% schneller agiert wie die gtx 680. immer diese gerüchte: GK110 monster chip für gaming.

nvidia wird bestimmt den GK110 für den profibereich einsetzen, wo sie genug geld kassieren werden.

und die anderen chips, wie sie auch immer heissen, werden auf die gamer losgelassen. was ja auch ausreichend ist.
 
@ Darkstar[GER]: Du meinst den GK100. GK110 ist (laut Namensschema) die 2. Entwicklungsstufe des Keplers. Und dazu sei gesagt: Wenn sie ihn (GK100) hätten bringen können, hätten sie es getan und wenn sie einen GK110 schon bringen könnten, würden sie es ebenfalls sofort tun.
Warum? Na gerade wegen des professionellen Sektors. Gerade weil man damit so viel Geld verdienen kann. Wer also sagt, dass NV es nicht nötig hätte nen großen Kepler zu bringen ist sehr kurzsichtig. Schließlich sind wir Zocker eher der nette kleine Nebenmarkt und der GF110 nicht wirklich die Erfüllung (in Bezug auf Leistung und Leistungsaufnahme verglichen mit einer 7970) und der GK104 einfach eine Lachnummer, wenn es um Computing geht.
 
Nvidia ist meist nach ihren eigenen interessen orientiert und nicht nach usern oder gamern.
der gamerbereich ist wirklich nicht so groß, professionelle bereich ist lokrativer für nvidia.
 
AFR ist die effizienteste und leichteste Multi-GPU-Lösung. Super-Tiling skaliert nicht über die Bank hinweg gut.
Das Beispiel mit 30 FPS auf S-GPU und 40 FPS M-GPU ist auch zu extrem gewählt. Geht man von einer durchschnittlichen Skalierung von 60-80% aus, dann hätte die M-GPU typischerweise eher 48-54 FPS.

Wo skaliert SuperTiling oder SLI denn schlecht? Alles eine Frage von Interconnect, Treiber und Engine, wenn der Interconnect gegeben wäre und Treiber und Engines/Spiele so gut auf SuperTiling optimiert wären wie sie es heute auf AFR sind sehe ich keine großen Probleme.

Ich denke das "bei gleichem Takt" solltest du dick schreiben ;)
Ich zweifel 1 Ghz und mehr stark an.

Ich auch... aber was nicht ist kann man ja übertakten, spätestens unter Wasser, in aufgebohrten drölf Phasen-ololol OC Editions

Was mal ganz interessant ist: 4870 X2 vs. 5870. Wir erinnern uns, der 5870 ist ein doppelter 4870 mit 100 Mhz mehr Takt und wohl leichten internen Verbesserungen. Der Vergleich ist also sehr passend.
Test: ATi Radeon HD 5870 (Seite 23) - ComputerBase

Zu Anfang ist die X2 sogar auf dem gleichen Level gewesen, da mehr Bandbreite pro Chip und die Work-Distribution wohl besser funktioniert, wenn das pro Chip erledigt wird. Das alles bei geringerer Rohpower.
Neuere Benchmarks wären sehr interessant, aber das Beispiel zeigt, dass eine S-GPU auch bei gleicher Rohpower die M-GPU nicht "deutlich" schlagen kann.
In dem Beispiel gar nicht.

Ich vermute das zum Teil das Speicherinterface limitiert. Hier sind Dual GPU Lösungen natürlich im Vorteil- die HD 5870 hat auch nur ein 256Bit Speichereinterface mit etwas höherem Takt.

Außerdem waren da die Treiber wohl noch nicht ganz ausgereift und Single GPU FPS ungleich Dual GPU FPS...

Es gibt auch ein schönes Gegenbeispiel: die GTX 280 befindet sich etwa auf dem selben Niveau wie die 9800 GX2- obwohl sie deutlich weniger Rohleistung hat, auch hier haben wir jeweils eine sehr ähnliche Architektur.

Es ist gar nicht hinderlich, weil gerade bei höheren Auflösungen und einer höheren Sample-Anzahl mehr Polys, Work-Units etc. anstehen und die Einheiten besser ausgelastet werden können.
Im Vergleich zu den anderen GPUs werden höhere BQ-Modis immer zu einem größeren Abstand führen, als ohne, falls die Einheiten passend skaliert wurden, was ja wohl der Fall sein wird.

Mehr Auflösung schafft nicht mehr Polygone...

Mit mehr Auflösung und mehr AA werden v.A. VRAM und ROPs immer stärker ausgelastet bis sie limitieren und der restliche Chip nichtmehr die volle Leistung bringen kann. Moderne High-End GPUs sind vor allem bei Spielen mit älteren Engines und hohen AA Modi oder Auflösungen meist nicht optimal ausgelastet.

@Locuza: Was hältst Du eigentlich davon, wie einfach wäre es für Nvidia zu machen den GK104 praktisch aufzubohren auf eine Chipfläche so groß wie GK110, ohne dessen andere, für Gaming unnötige Funktionen zu übernehmen. Vielleicht haben sie sich ja dazu entschieden aus der jetzigen Fertigungstechnik praktisch auch im Gaming Bereich alles rauszuholen. (Oder sie denken die Leistung braucht eh keiner bis Ende 13, bis die neuen Konsolen kommen). Ich meine so ein Chip ist ja in einigen Teilen recht modular, das könnte doch möglich sein. Ob es schnell umsetzbar ist, bis Anfang 2013, ist wieder eine andere Geschichte.

Der High-End Markt ist nicht groß genug um die Entwicklung eines eigenen Desktop GPU zu rechtfertigen wenn man bereits einen aus dem GPGPU Bereich hat, der fast genauso gut ist.

Die Entwicklung eines solchen Riesenchips ist auch immer alles andere als einfach, selbst wenn man im Vergleich zu einem anderen, vorhandenen Modell nur einige Funktionen "wegrationiert".

Nvidia ist meist nach ihren eigenen interessen orientiert und nicht nach usern oder gamern.
der gamerbereich ist wirklich nicht so groß, professionelle bereich ist lokrativer für nvidia.

Das stimmt nicht (!)

Auch wenn es in den letzten Jahren zum Teil den Anschein hat das nVidia versucht die Welt vom Gegenteil zu überzeugen ist der Gamermarkt viel (!) größer als der HPC-GPU Markt; die Entwicklungen für den Gamingsektor bringen HPC Karten als Nebenprodukt, nicht umgekehrt. Die Topmodelle haben dann eben ein paar HPC spezifische Optimierungen, weil es sich eben nicht auszahlen würde HPC und Gamer Chips getrennt zu entwickeln.

Das ist so seit der "GPGPU-Trend" mit "Tesla" aka GeForce 8 Serie (G80) begonnen hat und es ist nicht absehbar, das sich das ändert.

Würde nVidia die GPUs wirklich primär als Vektor-Coprozessoren für den HPC Bereich entwickeln würden sie etwas anders aussehen... eher etwa wie der Xeon Phi oder wie ein fetterer Cell.
 
Zuletzt bearbeitet:
@Locuza: Was hältst Du eigentlich davon, wie einfach wäre es für Nvidia zu machen den GK104 praktisch aufzubohren auf eine Chipfläche so groß wie GK110, ohne dessen andere, für Gaming unnötige Funktionen zu übernehmen. Vielleicht haben sie sich ja dazu entschieden aus der jetzigen Fertigungstechnik praktisch auch im Gaming Bereich alles rauszuholen. (Oder sie denken die Leistung braucht eh keiner bis Ende 13, bis die neuen Konsolen kommen). Ich meine so ein Chip ist ja in einigen Teilen recht modular, das könnte doch möglich sein. Ob es schnell umsetzbar ist, bis Anfang 2013, ist wieder eine andere Geschichte.
Ich halte das für Quatsch. Auch wenn es modular aufgebaut ist und natürlich vieles dadurch eine C&P-Sache geworden ist, so muss man dennoch validieren, Testsamples abwarten usw.
Wie soll ein Gk104+ denn aussehen? Der GK110 wird wohl um die 550mm² groß sein und hat schon 2.880 Shader.
Man muss nur kurz über über den Kosten/Nutzen-Faktor drüber gehen und wird erkennen, dass so etwas kein gutes Finanzmanagement wäre. Ich brauche eine eigenständige Maske ( die noch verdammt groß und teuer ist), ich muss den Chip wieder anders designen, ich muss wieder ein gutes Verhältnis der Einheiten und der Spannung untereinander ausrechnen usw., um was zu erreichen? Einen monströsen, über 3.000 Shader-Koloss auf den Kunden loslassen, um potentiell wohl 5% der Consumer anzusprechen?
Wie viel sollte ich dann dafür verlangen? Über 1.000 Euro werden es mindestens sein.
Das ist Quatsch. Entweder kommt der GK110 auch auf den Retail-Market und wird bei den DP-Units beschnitten und beim verfügbaren GDDR5-Ram, um einfach soviel wie möglich quer zu subventionieren oder sie lassen es und belassen es bei einem kleinem Update à la GK 114. Wobei mit einem 256-Bit SI kommt man allerdings nicht mehr weit.
Nvidia wird ganz sicher die Smarter-Choice wählen und einen günstigen GK114 nachschieben, der auf jeden Fall unter 450mm² bleiben wird und vielleicht den GK110 auch auf den Consumer-Markt werfen.


es wird immer zahlen von 50% bis 90% herumgeschmissen vor release und am ende können wir froh sein,
wenn die gtx 780 30% schneller agiert wie die gtx 680. immer diese gerüchte: GK110 monster chip für gaming.
Die Daten lassen bisher auch nichts anderes zu, außer der Speicher und der Core ist über 30% geringer getaktet.
Wenn ich davon ausgehe, dass der Chip mit 800-900 getaktet ist, dann kommt dennoch eine um die 60% höhere Shaderperformance auf das Blatt Papier.
Der Speicher kann statt mit 3.000 von mir aus mit 2400-2800 getaktet sein, dann hast du dennoch eine um mindestens 25% höhere Bandbreite. Du hast pro Thread 255 Register statt 63 und doppelt so viel L2-Cache.
Bei Compute wird auf jeden Fall gemetzelt.
Diese 30% sind keine Freude, sondern ein Minimum.


Edit:
Wo skaliert SuperTiling oder SLI denn schlecht? Alles eine Frage von Interconnect, Treiber und Engine, wenn der Interconnect gegeben wäre und Treiber und Engines/Spiele so gut auf SuperTiling optimiert wären wie sie es heute auf AFR sind sehe ich keine großen Probleme.
Bei Supertiling hast du keine einwandfreie Skalierung. Du bräuchtest, wie du schon selber erwähnt hast, fette Interconnects, um die Daten zwischen den GPUs schnell genug austauschen zu können, einen gemeinsamen Memory Pool, um die Daten weiterhin verwenden zu können. Supertiling skaliert nach meinem Stand nicht bei den Geometrie-Daten und hat Probleme bei Texturen, die über die Tiles herausragen, weswegen die Texturen auch für das benachbarte tile berechnet werden müssen.
Wenn das mit einem möglichen Aufwand gelöst werden könnte, dann wäre das ja schön, aber die Hersteller haben sich ja schon Jahrelang davor gedrückt bei AFR bessere Puffer und Frameratenausgaben zu implantieren.

Ich auch... aber was nicht ist kann man ja übertakten, spätestens unter Wasser, in aufgebohrten drölf Phasen-ololol OC Editions
Wenn wir die Papiertiger vergleichen, wozu sollten wir dann überhaupt OC-Möglichkeiten mit einschließen? :D

Außerdem waren da die Treiber wohl noch nicht ganz ausgereift und Single GPU FPS ungleich Dual GPU FPS...

Es gibt auch ein schönes Gegenbeispiel: die GTX 280 befindet sich etwa auf dem selben Niveau wie die 9800 GX2- obwohl sie deutlich weniger Rohleistung hat, auch hier haben wir jeweils eine sehr ähnliche Architektur.
In wie fern deutlich weniger Rohleistung? Die Pixelfüllrate war gleich, die Texelfüllrate viel geringer, die Speicherbandbreite war etwas höher und man hatte 1x 1Gb anstatt 2x512Mb, welcher der GX2 schon damals oft in den Magen gehauen hat. Dazu kamen mehr Register, Local-Memory, effizientere TMUs und aufgebohrte ROPs. Das ist glaube ich insgesamt mehr Veränderung als zwischen einer HD 4870x2 und einer HD 5870 ;)
Ich wollte auch nur einen Vergleich bei der Skalierung starten, nicht darüber debattieren, wie "gut" S-GPU FPS sind und wie gut D-GPUs.

Mehr Auflösung schafft nicht mehr Polygone...

Mit mehr Auflösung und mehr AA werden v.A. VRAM und ROPs immer stärker ausgelastet bis sie limitieren und der restliche Chip nichtmehr die volle Leistung bringen kann. Moderne High-End GPUs sind vor allem bei Spielen mit älteren Engines und hohen AA Modi oder Auflösungen meist nicht optimal ausgelastet.
Sorry, ich meinte mehr Pixel pro Polygon :redface:

Und ich habe hier auch nicht über die optimale Auslastung geredet, sondern bin über deine Formulierung gestolpert. Du hast eine "komplexe Architektur", als sub-optimale Lösung bei BQ-Modis eingeworfen.
Was irgendwie gegen eine Logik stößt, da die Skalierung beibehalten wurde und der Abstand mit größer sein wird, als ohne, weswegen ein GK110 das alles wohl effizienter abarbeiten würde.
 
Zuletzt bearbeitet:
Zurück