GT200 vs. RV770: Effizienz einzelner Funktionseinheiten

PCGH_Carsten

Ex-Redakteur
Vielleicht interessiert es ja hier den einen oder die andere (wenn nicht, dann eben nicht):

Ich habe mal versucht, die Effizienz der einzelnen Funktionseinheiten von RV770 und GT200 auf die schnelle zu isolieren so gut es halt ging. Dabei habe ich darauf geachtet, dass pro Texel möglichste dieselbe Bandbreite zur Verfügung steht, um die Ergebnisse nicht durch Unterschiede auf Chip-Level (im Ggs. zu Einheiten-Level) zu verfälschen.

Konkret verfügt der GT200 sowohl über doppelt soviele ROPs als auch Textureinheiten wie der RV770, benötigt daher auch die doppelte Bandbreite, wenn wir das pro Einheit zurückrechnen wollen, denn pro Einheit ist der RV770 mit mehr Bandbreite als der GT200 ausgestattet.

System: C2D E8500@ 3,8 GHz (400x9,5), DDR2-800 5.5.5.12, Windows XP SP3, Geforce 185.68 Beta, Catalyst 9.4 WHQL)
Karten:

• Geforce GTX280 (Zotac AMP) @ 576/1.404/1.296 (sollte 3,6 (theoretische) Bytes per (theoretischem) Texel ergeben)
• Radeon HD 4870 1G (Powercolor) @750/843,75 [lt. Anzeige im RT] (sollte 3,6 (theoretische) Bytes per (theoretischem) Texel ergeben)​
--
Theoretische Specs mit den angegebenen Takten (GT200/RV770)
Color-Fill: 18.432 / 12.000 (INT-Formate)
Tex-Fill: 46.080 / 30.000 (INT-Formate)
Z-Fill: 147.456 / 48.000 (INT-Formate)
AA-Fill: 73.728 / 48.000 (INT-Formate)
Bandwidth: 165.888 / 108.000
--
Bytes pro Einheit pro Takt:
ROP: 9 / 9
TEX: 3,6 / 3,6
--

Die folgenden Angaben sind die erreichten Prozentsätze des oben genannten theoretischen Maximums der jeweiligen Einheiten.

Colorfill (%)
-------------
Archmark 99,50 / 97,95
MDolenc 98,48 / 95,88
GZ easy 81,83 / 96,40


Z-Fill (%)
--------------
Archmark 95,09 / 101,84 (sic!)
MDolenc 52,32 / 44,66
GZ easy 19,67 / 67,13


Tex-Fill, Single (haupts. durch Bandbreite begrenzt) (%)
------------
Archmark 33,01 / --
MDolenc 39,37 / 38,39
GZ easy 32,78 / 30,41
3DM03 36,77 / 38,22
3DM06 37,12 / 38,92

Tex-Fill, Multi/Quad (%)
------------
Archmark 69,34 / --
MDolenc 94,69 / 78,00 (97,50)
GZ easy 85,16 / 70,12 (87,65)
3DM03 95,26 / 76,87 (96,08)
3DM06 98,86 / 79,71 (99,63)

Die Werte in Klammern beim Multitexturing sind die Prozentsätze, die man erhält, wenn man von den 32 Texturen, für die der RV770 pro Takt maximal Attribute interpolieren kann ausgeht anstelle der 40 Texturen, die er filtern könnte. Eigentlich war ich davon ausgegangen, dass die MT-Tests eher auf die Filter als auf die Interpolatoren anspringen...
 
Laut dem Ergebniss werden beide Chips sehr gut ausgelastet bzw. arbeiten ähnlich Effizient. Habe ich das richtig interpretiert?
 
Laut dem Ergebniss werden beide Chips sehr gut ausgelastet bzw. arbeiten ähnlich Effizient. Habe ich das richtig interpretiert?
Jein. In meinem Test habe ich ja die Taktraten verändert, um gleiche Bandbreite pro Funktionseinheit (außer ALUs) herzustellen. Im Real-Life sieht das besonders bei der Geforce etwas anders aus, die Radeon hingegen hat sogar noch mehr BB zur Verfügung.
 
Zurück