Da hat sich meines Erachtens KEINE der drei beteiligten Firmen (CDPR, nvidia, AMD) mit Ruhm bekleckert.
Bei den meisten von GPU-Herstellern zugelieferten Techniken (egal ob Hairworks, TressFX oder was ganz anderes) findet man eine sehr gute Optimierung auf die jeweils eigene Architektur und eher wenig Rücksicht auf Schwächen anderer vor. Genau wie bei diverser anderer Middleware mit etwas schwächeren Präferenzen hat der Entwickler dann die Option, selbst nachzubessern, oder seine Arbeitszeit in etwas zu investieren, was allen Spielen in gleichem Maße oder zumindest allen Preview-Screenshots zu gute kommt. Ich würde mir auch mehr Unabhängigkeit wünschen, aber es ist nicht die Aufgabe eines GPU-Testparcours, diese vorweg zu nehmen. Fakt ist, dass diese Techniken verwendet und mehrheitlich nicht nachoptimiert werden. Wenn wir das selbst nach Möglichkeit nachholen würden, würden für künstlich verbesserte Bedingungen für bestimmte Produkte schaffen. Das wäre, rein auf die Technik im Silizium bezogen, fairer, aber die Welt ist nicht fair. Die Gaming-Leistung in der Praxis hängt auch vom Software-Ökosystem ab und die wenigsten Gamer wollen derartig nachbessern oder wissen auch nur um die Möglichkeiten. Ganz besonders nicht, wenn die Grafik darunter leidet – man kann zwar darüber Streiten, ob zum Beispiel Hair Works realistisch ist (okay: Nein, kann man eigentlich nicht. Die Antwort ist zu offensichtlich) aber es sieht besser aus als gar keine Haaranimation. Da man bei einem fertigen Spiel selten mehr Alternativen zur Auswahl hat, wird also damit gespielt und genau so etwas möchte man doch testen. Sonst säßen wir alle vor synthetischen, bestmöglich auf jede Architektur optimierten 3D-Mark-Ergebnissen und würden uns wundern, dass reale Spiele ruckeln wie Hölle.
Ich habe mir zwar vorgenommen das ich mich wegen 5-10% nicht wie manch anderer streiten will.
Aber ist es denn so absurd anzunehmen das 52CU,s auf einer Fläche von 300mm2 platz finden werden.
Bei der XBOX z.B.: passen 56CU's (3584) auf eine Fläche von ca. 300mm2 davon sind 52CU's (3328) aktiviert.
Bei einem entsprechenden Desktop-Chip gäbe es wohl eine Variante mit 56CU's oder?
Ich verfolge die Konsolenentwicklung nicht so intensiv, aber auch auf Grundlage deiner Zahlen kann ich weder eine Bestätigung für 56 CUs finden noch eine Angabe zum Flächenverbrauch des GPU-Teils und Speicher-Controllers. Daher weiß ich nicht, ob diese Grundlagen für deine weitere Hochrechnung belastbar sind.
Aber bei meinem Beispiel versuche ich, betont eher zu untertreiben bzw. realistisch zu bleiben als den besten Fall herauszustreichen.
Weswegen ich nur mit 52CU's rechne.
Das wären eben 52/40=1.3, die 2Ghz sind meiner Meinung nach das zu erwartende Minimum. Wenn man zum einten mitberücksichtigt das die XBOX bereits mit 1.825GHz taktet und zum anderen die 5700XT bereits einen Takt von 1.9GHz hat ist das nun wirklich als realistisch einzuschätzen.
(Die 2080ti FE hat übrigens nur einen Takt von 1.623 GHz eine entsprechende OC Variante legt da natürlich nochmals 10-20% oben drauf)
1.3x2/1.9= 1.37 x 1.05 (IPC) = 1.44. Wenn jemand der Meinung ist das die 5% IPC unrealistisch sind dann soll er es sagen.
Klar werden die 52CU's nicht linear skalieren und ich rechne daher auch mit einem Verlust von ca. 5% dann wären wir bei +40%
Das SI und die Geschwindigkeit des GDDR6 wird am Ende aber entscheidend sein ober diese Leistung auch auf die Strasse gebracht werdenn kann.
Der einte oder andere wird jetzt sicherlich mit Bezug auf die Skalierung der 5700/5700XT sagen aber da kommt doch nur die Hälfte der theoretisch möglichen Steigerung am Ende raus.
Aber da wird nicht mitberücksichtigt das beide Karten die selbe Speicherbandbreite haben und daher die Werte der 5700XT bis zu einem gewissen Grad verfälscht sind und daher nur sehr limitierte Aussagen gemacht werden können.
Es sei denn jemand hat ein Test wo die Speicherbandbreite bis zu diesem Mass höher ist zur Hand?
Ich möchte nochmals betonen das es mir nicht darum geht diesen Chip möglichst gut dastehen zu lassen.
Denn dann würde es eher folgendermaßen aussehen: 56/40x2.1/1.9x1.1=1.70 (170% - 5% 165% Skalierung relativ 5700XT)
Klar wird die so sehr wahrscheinlich nicht kommen und das wäre jetzt wirklich auch zuviel des Guten (Das wäre in etwa 2080ti max. OC)
1. Aber trotzdem frage ich gibt es denn nicht bereits 56CU's auf 300mm2 ?
2. Sind 2.1GHz bei einem 50% effizienteren Chip so abwegig?
3. Wurde denn eine IPC Steigerung von offizieller Stelle nicht bereits bestätigt?
4. Und wie hoch soll die denn aussehen. Bei GCN/RDNA1 waren es 25% sind da bein Sprung auf RDNA2, 10% übertrieben?
Grundsätzlich ist es so, dass Taktbarkeit, Platzbedarf, IPC und Verbrauch alles gegenläufige Optimierungen sind. Man kann viel Platz herausholen, wenn man die Transistoren kleiner baut, enger verschachtelt, aber dann wird man größere Probleme mit gegenseitigen Störungen, zu geringer Schaltleistung und somit schlechter Signalqualität bei höheren Taktraten haben. Oder man steigert die effektive IPC durch Hilfseinheiten und Caches, die ein flüssigere Arbeiten der Haupteinheiten ermöglichen, oder zum Teil in dem man den Rechenwerken stärkere/schnellere Transistoren oder multiple Wege für verschiedenen kritische Szenarien beschehrt. Aber das braucht dann mehr Platz. Und zu guter letzt kennt jeder die Verknüpfung von Verbrauch, Zahl der Einheiten und Spannung, also Takt der Einheiten.
Ist es also möglich, dass auf einen 20 Prozent größeren Chip 37 bis 40 Prozent mehr Einheiten nebst einem passend ausgebaute SI, in Relation gleich großen Caches, usw. passen? Sicherlich, wenn sie nicht schon vorher maximal komprimiert waren, liegt das im Bereich des möglichen. Aber werden sie nach dieser Schrumpfkur den gleichen oder gar einen besseren Takt bei gleichen Verbrauch erreichen? Sehr unwahrscheinlich.
Genauso: Ist es möglich, nach 1,5 Jahren den Takt um 10 Prozent zu steigern? Ganz sicher klappt das. Intel macht seit einem halben Jahrzehnt nichts anderes. Aber klappt das auch bei gleichem Verbrauch? Selten. Und klappt es bei gleicher Grundfläche? Besagte Intel-Ingenieure sollen bei 14nm++ wohl ein paar Maße gelockert haben, um mehr Speed rauszuholen...
Und das gleiche gilt für eine IPC-Steigerung. 10 Prozent mehr als RDNA1 im realen Durchschnitt sind vielleicht machbar. Ich würde bei so weitreichenden Änderungen dann zwar direkt einen neuen Namen vergeben, aber das ist für die Diskussion egal. Nur würde sowas sicherlich nicht ohne eine Steigerung des Platzbedarfes klappen. GCN5 brauchte circa 20 Millionen für eine CU nebst zugehörigem Anteil an Cache, SI, usw.. Navi10 braucht 25 Millionen. Beim Wechsel von Vega64 zu RX5700XT viel das nicht weiter auf, weil man gleichzeitig einen riesigen Sprung in der Fertigung machte. Aber den gibt es diesmal nicht. Im Gegenteil, der erste und wichtigste Faktor deiner Hochrechnung verlangt einen um 15 Prozent reduzierten Platzbedarf.
Nimmt man alle Forderungen zusammen, 9 Prozent mehr Takt bei 11 Prozent weniger Platzbedarf, 5 Prozent mehr IPC und 50 Prozent mehr Effizienz (für die Zahlen, mit denen du gerechnet hast), dann sage ich ganz klar: Nein, das alles gleichzeitig zu schaffen ist praktisch unmöglich. Letzteres halte ich sogar insgesamt für nicht schaffbar, wenn wir von gleichem Takt und gleicher Fertigung ausgehen. Derartige Effizienzfortschritte, wie wir sie in der Vergangenheit zwischen konkreten Modellen gesehen haben, gingen immer mit einer deutlichen Vergrößerung der Chips einher, in aller Regel wurden mehr Einheiten deutlich niedriger getaktet. Nur aus technischem Fortschritt heraus wären 50 Prozent mehr Effizienz schon einem Fertigungs-Fullnode gut zu Gesicht stehen, also echten 5 nm.
Was ich, ausgehend von deinen X-Box-Zahlen für plausibel halten würde: 11 Prozent weniger Platzbedarf und eine Balance aus Taktbarkeit, IPC und Fertigungsfortschritt, die auf ±0 rausläuft. Das heißt man kann die kleinen Einheiten auf den gleichen Takt prügeln, wenn man will, dann hat man aber seinen angesammelten Effizienzvorteil verspielt und würde bei einem Chip mit 30 Prozent mehr Einheiten auch 30 Prozent mehr verbrauchen. Oder man senkt den Takt ab, möglicherweise sogar ein Stück unter 5700XT-Niveau, holt dadurch die nötige Effizienz heraus und kann dann mit einem 40 Prozent größeren Chip, 60 Prozent mehr Einheiten und moderaten 10-20 Prozent mehr Verbrauch die gewünschten 50 Prozent mehr Leistung rausholen. Aber das ist dann eben schon ein deutlich teurerer Prozessor und die gesamte Rechnerei geht immer noch von 100 Prozent Skalierung aus, berücksichtigt nicht den Bedarf an mehr RAM pro Rechenleistung für eine neue High-End-Karte und wir schweigen die ganze Zeit über zum Thema RTX, das AMD eigentlich durch !zusätzliche! Hardware-Funktionen beschleunigen wollte, die zusätzlich Chipfläche und Verbrauch kosten müssen, ohne die herkömmliche Rendergeschwindigkeit positiv zu beeinflussen.
Ja, wollte nur die allgemeine Diskrepanz in den Raum werfen. Es gibt auf YT bspw. sehr viele Videos wo die 5700XT gegen die 2070 SUPER antritt und die 2070 nur in wirklich NVidia-optimierten Spiele merklich die Nase vorn hat und nicht nur 2-3 fps, wobei auch die 5700XT bei AMD-optimierten Spielen natürlich wiederum profitiert. Was ich damit sagen will, beide Grafikkarten nehmen sich nicht viel. Mag sein, dass die 2070 SUPER einen Tick besser optimiert ist, aber im Grunde genommen spielt die 5700XT eher in ihrer Liga und nicht in der von der 2060 SUPER. Preislich gesehen macht das m.E. nach keinen großen Unterschied und durchschnittlich 100-120€ mehr für maximal 5% Leistung mehr zu berappen ist, gelinde gesagt, fragwürdig. Aber muss natürlich jeder selber wissen.
Beim Preis stimme ich dir definitiv zu, meine letzte zum Vollpreis gekaufte Nvidia war eine 9800 GTX. Aber bei der Leistungswertung kann ich nur wiederholen: Unsere Messungen sprechen eine andere Sprache und während ich mich aus einem sorgfältig dokumentierten, gut geplanten Test gerne Informationen hinzu gewinne, ist "sehr viele YT-Videos" eine Kategorie, die sehr viel Crap enthalten kann. Nicht muss – aber kann. Und "kann oder kann auch nicht" werde ich nicht bezüglich +5 Prozent versus +10 Prozent interpretieren. Da kann man froh sein, wenn man eine belastbare Rangfolge erhält.
Der Zuckerberg ist doch keine Echse der wurde erst heute als der Joker entlarvt.
Diese Argumentation geht von der Annahme aus, dass der Joker keine Echse ist, aber ist dem so? *AkteXMelodie*
