AW: Kepler: Zwei neue Bilder einer mutmaßlichen GTX 680 im Umlauf
Ich frage mich nur wie Nvidia das mit den 3 mal mehr Cuda Cores bei nur 18% mehr Transistoren schafft. Gut das schmalere Speicherinterface spart Transistoren und gewisse GPGPU Teile des Chips fallen vieleicht auch zum Opfer. Entweder ist habe ich die falsche Vorstellung wieviele Transistoren ein Cuda Core benötigt.
Nvidia will mit weniger Transistoren, weniger Shadern, geringere Speicherbandbreite und geringere TDP AMD leistungsmäßig überflügeln. Auch wenn meine Rechnung sehr allgemein gehalten ist, sollte jedem klar sein das Nvidia auch nur mit Wasser kocht. Ich denke das der Kepler max. (trotz zweifeln) 20% schneller als eine HD 7970 sein könnte.
Hier die "Rechnung" (immer Full HD ohne AA, es wird nur das Transistorbudget betrachtet)
HD5870 (2,15 Mrd. Transistoren) vs HD6970 (2,64 Mrd. Transistoren) = Leistungsvorteil (laut CB) Letzterer ca 10%
Anmerkung: 25% mehr Transistoren werden benötigt um im Schnitt 10% mehr Leistung zu erbringen.
HD6970 (2,64 Mrd. Transistoren) vs HD7970 (4,31 Mrd. Transistoren) = Leistungsvorteil (laut CB) Letzterer ca 32%
Anmerkung: ca 60% mehr Transistoren werden benötigt um im Schnitt 35% mehr Leistung zu erbringen.
GTX 285 (1,4 Mrd. Transistoren) vs GTX 480 (3.0 Mrd. Transistoren) = Leistungsvorteil (laut CB) Letzterer ca. 70%
Anmerkung: mehr als doppelt soviele Transistoren werden benötigt um im Schnitt 70% mehr Leistung zu erbringen.
GTX 580 (3,0 Mrd. Transistoren) vs GTX 680? (3,2 Mrd. Transistoren) = ?
Anmerkung: 18% mehr Transistoren sollen reichen um mindestens 40% mehr Leistung (20% über Radeon) zu erreichen!
1. Es werden die Cores ja nicht einfach verdreifacht, sondern auch umgebaut. Sie takten rund 400 mhz weniger, dadurch kann Nvidia die Pipeline kürzer machen und deswegen werden die Cores auch kleiner. Zusätzlich sinkt natürlich der Verbrauch und die Hitzeentwicklung eines Cores, was Nvidia den Vorteil verschafft weniger Luft ,wegen Hitze und Leckströmen, zwischen den Cores lassen zu müssen -> höhere Packdichten. Nvidia kann auch die Cores allgemein verbessern und etwas reorganisieren.
Statt 3x16 Vec zu verbauen (48 Cores) werden jetzt wohl 3x 32Vec ( 96 Cores) verbaut. Dadurch könnte man die Dichte noch einmal erhöhen.
Das Interface ist statt 384 Bit 1/3 kleiner. Spart Platz und Transistoren. Das Interface soll einer der Sachen sein, die fast kaum kleiner werden pro Fertigungsschritt. Gipsel hat einmal ausgerechnet, dass das Tahiti Interface etwa mehr als 16% vom DIE verbraucht. Das sagt jetzt nicht viel über den Transistorenverbrauch aus, aber wie viel Platz man einsparen kann, wenn das Interface jetzt 1/3 kleiner wäre.
Wie du auch weiter richtig ausgeführt hast, fallen spezielle Fähigkeiten weg, wie z.B. die Fähigkeit das DP:SP Ratio auf 1:4 oder so ähnlich zu schalten, sondern wird es auf 1:16 kastrieren. Tahiti hat hier 1:4 und 384-Bit.
Die Speicherbandbreite kann natürlich ein Flaschenhals werden, aber wenn der Chip damit effizient umgeht und dieser hochgetaktet ist, sollte ein GK104 damit leben können.
2. Laut Napoleon wird der GK104 3.54 Transistoren beinhalten.
3. Ist dein Vergleich zwischen Leistungsplus und Transistourcount bedingt vergleichbar. Je nach dem, wohin man die Transistoren steckt und wie man den Chip aufbaut, kann es sein das er kaum davon profitiert, aber 20% mehr Transistoren benötigt.
4. Ein GK104 wird wohl keine 20% schneller sein als ein Tahiti XT sondern wohl ziemlich arg in der Nähe sein. Vielleicht durchschnittlich 5 +15% schneller?
(Jedenfalls könnten OC-Versionen sich ordentlich batteln?)
"Einen Vergleich darf man im übrigem im jedem Feld ziehen."
etwas primitiv dein spruch - sorry, man kann eben nicht alles miteinander vergleichen. es ist einfach nicht alles gleich.
mfg
Und wieso sollte man sich nur auf den Spielevergleich beschränken? Das ist Hardware und Hardware kann ich in jedem Bereich vergleichen. Manch ein Vergleich ist sinnvoll manch anderer weniger. Man kann unter allen Aspekten dann einen Objektiven Vergleich für mehrere Einsatzfelder schaffen. Will man sich speziell auf einen Bereich konzentrieren, macht es dann natürlich keinen Sinn sich zusätzliche Faktoren an zu sehen, die dort gar nicht gebraucht werden.
Ich kann sehr wohl vergleichen wie die Chips arbeiten, was jeweils ein IHV anders macht, welche Auswirkungen das auf seine Leistungsfähigkeit in XYZ hat, wie viel Strom er dabei verbraucht usw.