PCIe-OC und HT-Link unter der Lupe

V

VikingGe

Guest
PCIe-Takt, HT-Link und die Spiele-Performance
Ja, ich gehöre inzwischen zu den Leuten, die alles übertakten, was nicht bei drei auf den nächstbesten Baum klettert - und seit ein paar Wochen sind dem auch PCIe-Bus und HT-Link auf meinem System zum Opfer gefallen. Die ersten werden jetzt schreien "Das bringt doch eh nichts!" - nun, genau dem wollte ich auf den Grund gehen und habe dafür einige Tests durchgeführt.


System
cpu-z-new.PNG
CPU: AMD Phenom II X6 1090T (3.8 GHz, 3.0 GHz NB)
RAM: 2x4GB G.Skill Eco DDR3-1720 CL9-9-9-26-1T
Board: Asus M5A97
GPU: NVidia GeForce GTX 670 @1188/1775

Wie unschwer zu erkennen sein dürfte, läuft da Windows 8.1, und bis auf Assassin's Creed Unity wurden alle Tests noch mit dem damals aktuellen GeForce-Treiber 346.65 gemacht.


Kurz vorweg....
Generell ist PCIe-OC nicht empfehlenswert, wenn man neben der Grafikkarte noch zusätzliche Steckkarten benutzt, und auch einige Controller können bei zu hohen Taktraten durcheinander kommen und Datenmüll produzieren. Auf meinem System, in dem außer der Grafikkarte keine Zusatzhardware verbaut ist, laufen die 120 MHz stabil, höhere Taktraten habe ich allerdings nicht getestet, da man dort doch langsam in ungesunde Bereiche vorstoßen dürfte.


Theoretische Werte
Grundsätzlich ist der PCIe-Bus - wer hätte das gedacht - dafür zuständig, Daten vom RAM bzw. der CPU an die Grafikkarte zu schicken - und je schneller das geht, desto besser. In umgekehrter Richtung natürlich auch, allerdings spielt diese oft nur eine untergeordnete Rolle. Zuständig für die eigentliche Übertragung ist auf AM3+-Systemen der HyperTransport-Link, dem man die Eigenschaft zuschreibt, absolut nichts an der Systemleistung zu ändern.

Schauen wir uns also mal an, welche Takterhöhungen welchen Einfluss auf die tatsächliche Bandbreite der Verbindung haben:
Bandwidth.png
Spätestens jetzt sollte klar sein, warum einfaches Übertakten des HT-Links nichts bringt - einzig die weniger wichtige Download-Richtung profitiert, in Upload-Richtung tut sich praktisch gar nichts.
Umgekehrt verhält es sich mit PCIe-OC, ohne den HT-Link anzuheben - auch hier profitiert nur eine Richtung. Allerdings nur mit schlechter Skalierung, das ändert sich erst, wenn man beide Frequenzen um etwa dieselbe Größenordnung anhebt. Im konkreten Fall sorgen jeweils 20% mehr Takt für eine um 20% gesteigerte Host to Device-Bandbreite - eine 1:1-Skalierung.

Generell ist die Effizienz relativ schwach - von den theoretisch möglichen 8.0 GB/s bei 100 MHz bzw 9.6 GB/s bei 120 MHz bleiben jeweils nur etwa 70% Bandbreite übrig. Das scheint allerdings normal zu sein, viel mehr als das erreichen die Leute im verlinkten EVGA-Thread auch nicht, aktuelle PCIe 3.0-Systeme erreichen etwa die doppelte Bandbreite.

Benutzt habe ich für diesen Test nebenbei das concBandwidthTest-Tool, das irgendjemand mal im Nvidia-Forum präsentiert hat und inzwischen auch hier als Windows-Version verfügbar ist.


Spiele-Tests
Grundsätzlich ähnelt das hier den auch schon bei PCGH durchgeführten Tests, ob PCIe 3.0 gegenüber 2.0 einen Vorteil bringt - die relativ oft mit dem Ergebnis enden, dass es zumindest bei Single GPU-Systemen keine Unterschiede gibt. Allerdings wird dort in aller Regel mit aktueller High End-Hardware getestet, die ich nicht habe, deswegen kann das hier alles ganz anders aussehen. Getestet wird in 1080p mit höchsten Einstellungen, sofern nicht anders angegeben.

Die "Zwischenkonfigurationen", wo jeweils nur eine der beiden Taktfrequenzen erhöht wurde, lasse ich im Folgenden allerdings raus - die theoretischen Unterschiede sind zu gering, um von Interesse zu sein.


The Witcher
Witcher.png
Dieses Spiel ist absolut CPU-Limitiert, leidet unter extremen Hängern, Rucklern, Aussetzern und generell absolut unterirdischer Performance und nutzt nur einen Kern - deswegen die Hoffnung, dass die Erhöhung der Übertragungsgeschwindigkeit zumindest ein bisschen was bringen könnte.
Leider bestätigt das Spiel allerdings eher die existierenden Tests - es tut sich nichts. Möglicherweise eben weil es nur einen Kern nutzt, der Treiber kann die meisten Datenübertragungen problemlos asynchron erledigen.


The Witcher 2
Witcher2.png
Der Nachfolger, dank Übersampling problemlos im Grafiklimit, zeigt sich ebenfalls komplett unbeeindruckt und liefert sogar praktisch identische Werte für die beiden Konfigurationen.


Ryse: Son of Rome
Ryse.png
Ryse legt um gut 4% zu. Das ist insofern interessant, als dass der Grafikspeicher in dem Spiel trotz hochauflösender Texturen kein großes Problem darstellt und die CPU sich langweilt, ähnlich wie in The Witcher 2 - warum wird ausgerechnet dieses Spiel schneller?
Spürbar ist der Performance-Gewinn natürlich nicht, da Ryse ohnehin schon sehr gleichmäßige Frameraten liefert, aber endlich gibt es mal interessante Zahlen.


The Elder Scrolls V: Skyrim
Skyrim.png
Skyrim mit Mods (über)fordert sowieso jedes System, aber besonders den 2GB kleinen VRAM meiner Grafikkarte. Eigentlich sollte gerade in solchen Fällen die Bildrate steigen oder wenigstens das sporadische Geruckel abnehmen, trotzdem sind keine großen Unterschiede mess- oder gar spürbar.


The Evil Within - Demo
TEV.png
Auch Id Tech 5-Spiele sind jetzt nicht unbedingt dafür bekannt, zimperlich mit dem Grafikspeicher umzugehen, trotzdem ändert sich nichts. Dabei dürfte gerade in diesem Spiel dank MegaTextures relativ viel Kommunikation mit der Grafikkarte stattfinden - der limitierende Faktor ist in diesem Fall aber die CPU.


Assassin's Creed 4: Black Flag
AC4.png
Dieses Spiel ist performancetechnisch ein Krampf: PhysX ist in jeder Einstellung ein Übeltäter (deswegen auch deaktiviert), Adaptive VSync aus irgendwelchen Gründen allerdings genau so - und wenn es dann mal läuft, wird es durch den übertakteten Bus sogar langsamer. Keinesfalls spürbar, aber es geht messbar etwas Leistung verloren - sogar mehr als die meisten getesteten Spiele gewinnen.


Assassin's Creed: Unity
AC5.png
Der Nachfolger, der mit FXAA und ohne PCSS auskommen muss, überrascht dann aber doch etwas und legt mit großem Abstand am stärksten zu. Wahrscheinlich liegt das an der Kombination aus extrem hohem VRAM-Bedarf - 2GB sind für das Spiel in FullHD zu wenig - und der relativ hohen CPU-Last. Als Benchmark-Szene diente hier der Sprung von Notre Dame, gefolgt von einem kurzen Gang durch die Menschenmenge in eine Gasse, dort ist mein X6 bereits gut am Ackern, ohne jedoch zu limitieren.
Der Vorteil ist in diesem Spiel jedoch so groß, dass man ihn spürt. Es kommt zwar nach wie vor immer wieder zu kleinen Rucklern, daher auch die sehr niedrigen Min-FPS, allerdings fallen diese mit übertaktetem Bus weniger heftig aus - generell wirkt das Spiel ein bisschen flüssiger.
Übrigens fallen die Unterschiede in 720p geringer aus und die Ruckler werden noch weniger und noch weniger heftig. Hier wird der Performance-Boost definitiv etwas mit dem VRAM zu tun haben.


Fazit
Die meisten werden es sicherlich geahnt haben, in den allermeisten Fällen lohnt es sich nicht, den PCIe-Takt anzuheben, und das sind dann wohl auch genau solche Spiele, die recht gleichgültig auf PCIe 3.0 reagieren würden. Einzig Ryse und Unity profitieren überhaupt, letzteres wegen des zu kleinen VRAMs, ersteres aus Gründen, die ich nicht verstehe. Allerdings sind beides Spiele, die jetzt jemand gerne als "echte Next Gen-Titel" bezeichnen würde - möglicherweise gibt es da einen Trend und zukünftige Spiele profitieren tatsächlich stärker von einer schnelleren Schnittstelle.

Speziell für Unity war es aber gar nicht mal die dümmste Idee, an den beiden Taktschrauben zu drehen und da es in der Regel auch nicht schadet (mit AC4 ist natürlich die obligatorische Ausnahme von dieser Regel vertreten), lasse ich das hier auch weiterhin so laufen - das ein- oder andere halbe Prozent Leistung nehme ich dann ja doch ganz gerne mit. Nötig oder generell empfehlenswert ist es aber auf keinen Fall.
 
Netter Test ! Warm mir aber alles bekannt.
Für die Stabilität des Phenom Systems immer so nahe wie möglich mit dem HT Link bei 2000MHz bleiben.
Nie über 2200 drüber.

Bei deinem Rechner würde es viel mehr bringen auf 1866MHz Speicher mit CL8 einzubauen denn dann auf 1900MHz mit CL7-8-9-16-25 1t laufen zu lassen.
Alles machbar mit diesen Riegeln.

http://preisvergleich.pcgameshardwa...x-dimm-kit-16gb-f3-1866c8d-16gtx-a855487.html

Der maximale Takt geht noch mehr bin ich sicher, selbst bei 1,45V Vcore ist da mehr drin.
CPU-NB ist gut bei 3000MHz viel schneller geht es da nicht mehr.
 
Erstmal danke fürs Feedback. Klar wäre flotterer Speicher sinnvoller, aber mit Kosten verbunden :ugly: und das nächste System wird eh DDR4.

Für die Stabilität des Phenom Systems immer so nahe wie möglich mit dem HT Link bei 2000MHz bleiben.
Also bislang läuft das hier absolut stabil (wie gesagt schon seit ~3 Wochen bei recht intensiver Nutzung). Insofern interessant, als dass ich bei meinem alten OC-Test, wo ich das schonmal testen wollte, Probleme hatte, überhaupt 2400 zu starten. Und mit Standard-HT-Link bringt der PCIe-Takt noch weniger als sowieso schon.

Der maximale Takt geht noch mehr bin ich sicher, selbst bei 1,45V Vcore ist da mehr drin.
Nicht wirklich. Board läuft am Limit und bei 1.45V führt alles jenseits der 3700 MHz zu Abstürzen.
Bin ehrlich gesagt ganz froh, dass meine aktuelle Konfiguration so stabil ist, dass auch mal drei Tage Volllast kein Problem sind. Ist zwar selten nötig, kommt aber vor.
 
Zuletzt bearbeitet:
Zurück