AMD Radeon RX Vega 64 und RX Vega 56 Overclocking/Undervolting-Thread

Würde auch mal so wie Janni rangehen mit HBM-Takt ca. 960 und tREF auf nur 15600 setzen,
falls der Crash definitiv an der Graka liegt.
Zusätzlich fällt natürlich auf, das ein Setting mit sehr großem Abstand P6-7 >> P5-6 evtl. nur künstlich am Leben gehalten wird durch das TDP-Limit+20, was ja rel. klein ist.
Da könnte man mal den P7 auf 1652..1662 setzen und mit PT+50 testen, ob das Setting insgesamt überhaupt stabil ist.
Das Du dafür immer erst 20min GRW spielen musst ist natürlich belastend. Schade das 3x Sup4k hintereinander net zum verifizieren der Stabilität reichen.
Ansonsten könnte man in dem Game selbst einfach mal 1-2 Regler links testen, wenn Du keine Lust hast das Wattman-Profil zu ändern.

Wenn z.Bsp. der Treiber gar net abstürzt kann s auch am Ram OCen liegen.(x)
Games die viel Streamen stressen den Arbeitsspeicher halt auch mehr.(D2)

(x) In der Ereignisanzeige vom W10 könnte man sich mit etwas Glück auch die Ursache
raussuchen.
 
Zuletzt bearbeitet:
Danke Jungs,
dachte der HBM äußert sich eher durch Artefarkte bevor es crasht. Aber ich werde alle Tipps mal umsetzen.

Division2 habe ich auch, aber aktuell keine Zeit/Lust darauf.
@rx: Bei der abgebildeteten Konfig ist nur der Timing Level auf 1 gesetzt. Ansonsten Werkstimings. Das hatte ich ebenfalls schon probiert, da ich in anderen Spielen (Anno1800 und auch Bf1) die harten Timings von Rumpelson fahren kann, ohne jegliche Probleme versteht sich.
 
TimingLvl =0 soll auch stabiler sein. Den bitte im Wattman ändern.

Ob der HBM selbst oder der SOC irgendwann instabil werden, kann man halt net an Artefakten sehen.
Rumpelson hatte ja extra noch in der Registry irgendwie den SOC-Takt von 1107 auf 1028(?) runtergesetzt,
um stabiler zu werden.
Und dann ist halt HBM auch tempabhängig. Das fiel besonders mit den 64ern an der Schwelle 1100 zu 1110 auf,
wo einige Grakas erst unter h2o mit 50°C stabil wurden.

edit:
Ich würde mich momentan auch net so sehr auf Optimieren versteifen weil eh im Dezember sicher wieder ein sehr interessanter Treiber kommt. Lieber dann etwas mehr Zeit investieren.
 
Zuletzt bearbeitet:
Ob der HBM selbst oder der SOC irgendwann instabil werden, kann man halt net an Artefakten sehen.
Rumpelson hatte ja extra noch in der Registry irgendwie den SOC-Takt von 1107 auf 1028(?) runtergesetzt,
um stabiler zu werden.
Und dann ist halt HBM auch tempabhängig.

SOC Takt habe unberührt gelassen. Temps sind alle unkritisch (wie schon geschrieben). Habe den HBM jetzt auf 960 Mhz gestellt und es scheint jetzt sauber zu laufen. Sogar mit straffen Timings :)

Ich würde mich momentan auch net so sehr auf Optimieren versteifen weil eh im Dezember sicher wieder ein sehr interessanter Treiber kommt. Lieber dann etwas mehr Zeit investieren.

Am Optimieren bin ich eigentlich aktuell auch nur gezwungenermaßen. Die aktuelle Konfig ist soweit eigentlich gut getestet gewesen und lief wunderbar. Nur jetzt bei dem Spiel gabs die Probleme. Aber hoffentlich ist das jetzt auch behoben.

Ist schon geil wenn die Karte statt 210 W plötzlich nur noch 150 W verbraucht :)

Danke, Jungs.
 
Hallo zusammen,

ich versuche mich gerade daran meine Vega 56(Rajintek Morpheus 2 Umbau) zu overclocken. Ziel dabei ist es sie nicht unbedingt an der Kotzgrenze laufen zu lassen aber auf einem hohen Niveau.
Ich habe bisher auf Windows overclocked und getestet und bin mit folgenden Einstellungen ganz zufrieden(Habe die Einstellungen aus diesem Thread):

uv_5_settings.PNG
uv_5_benchmark.png

Da ich Windows nur zum testen nutze und mein Zielsystem Linux ist habe ich die Einstellungen nachdem sie auf Windows stabil liefen(Superposition Benchmark + Witcher 3) auch so in Linux übernommen.
Der Superposition Benchmark liefert allerdings einen niedrigeren Wert.

Superposition_Benchmark_v1.1_5310_1575810653.png

Das könnte natürlich an den unterschiedlichen Grafik APIs liegen oder der Implementierung in Superposition, aber gibt es auch eine Möglichkeit seine Ergebnisse aus Windows auch mit Linux zu verifizieren und sind die OpenGL Ergebnisse immer schlechter wie die DirectX Ergebnisse?

Noch ein Problem auf welches ich unter Linux gestossen bin ist es eine Lüfterkurve vernünftig einzustellen. Da ich auf dem Morpheus 2 die Arctic P12 PWM PST verbaut habe ist die Range der Lüfter natürlich auch anders als die der Referenzlüfter.
Range Arctic P12 PWM PST: 200-1800RPM
Referenzlüfter: ???

Wenn ich zum Beispiel ein Fan Level von 216 (85%) einstelle und danach die aktuelle RPM der GPU auslese bekomme ich 81 (31%) zurück.
Gibt es jemand der sein Vega56 oder Vega64 auch unter Linux laufen hat und andere als die Herstellerlüfter verwendet bzw weiß jemand wie die RPM Range der Referenzlüfter ist?
 
Noch ein Problem auf welches ich unter Linux gestossen bin ist es eine Lüfterkurve vernünftig einzustellen. Da ich auf dem Morpheus 2 die Arctic P12 PWM PST verbaut habe ist die Range der Lüfter natürlich auch anders als die der Referenzlüfter.
Range Arctic P12 PWM PST: 200-1800RPM
Referenzlüfter: ???

Wenn ich zum Beispiel ein Fan Level von 216 (85%) einstelle und danach die aktuelle RPM der GPU auslese bekomme ich 81 (31%) zurück.
Gibt es jemand der sein Vega56 oder Vega64 auch unter Linux laufen hat und andere als die Herstellerlüfter verwendet bzw weiß jemand wie die RPM Range der Referenzlüfter ist?

Kann nur die Werte für die Sapphire Pulse Vega 56 liefern.

0%-11% Laufen die Lüfter nicht an --> 0 RPM
bei 12% laufen die Lüfter mit ca. 500-525 RPM
bei 100% laufen die Lüfter dann mit ca. 3250-3275 RPM



LG Bandou
 
Ich habe bisher auf Windows overclocked und getestet und bin mit folgenden Einstellungen ganz zufrieden

Da ich Windows nur zum testen nutze und mein Zielsystem Linux ist habe ich die Einstellungen nachdem sie auf Windows stabil liefen(Superposition Benchmark + Witcher 3) auch so in Linux übernommen.
Das könnte natürlich an den unterschiedlichen Grafik APIs liegen oder der Implementierung in Superposition, aber gibt es auch eine Möglichkeit seine Ergebnisse aus Windows auch mit Linux zu verifizieren und sind die OpenGL Ergebnisse immer schlechter wie die DirectX Ergebnisse?

Noch ein Problem auf welches ich unter Linux gestossen bin ist es eine Lüfterkurve vernünftig einzustellen. Da ich auf dem Morpheus 2 die Arctic P12 PWM PST verbaut habe ist die Range der Lüfter natürlich auch anders als die der Referenzlüfter.

Erstmal sehr schönes Setting.(x) Wie sind die Hotspot und VRM-Temps mit dem M2 ?
Hast Du die Kontaktfläche noch geschliffen? (falls es net die Vega-Edition ist)
Welche WLP hast Du verwendet? Noch irgendwelche Pads bei den VRM geändert ?

Linux@OGL wird vermutlich immer schlechter laufen. Ein Game@Vulkan wäre interessant.

Das bei der Drehzahl die Lüfter@Morpheus anders angezeigt werden ist normal. Kein Vgl. mit Original möglich.
Würde mich da nur nach den Temps richten. Gurdi lässt seine wohl immer mit ca. 1600 laufen. (NF12)

edit:
(x) Habe net genau hingeschaut, steckt noch ein mue zu viel 64 drin.
Für die 56 gehts evtl. noch kühler. siehe Post#6009
 
Zuletzt bearbeitet:
@Bandou Danke dir für die Werte.

@RX480 Während eines Superposition 4K Optimized run werden GPU-Hotspot, GPU-VRM und SOC-VRM etwa 77°C warm. Wenn ich eine Zeit lang Witcher 3 zocke werden sie ungefähr 73°C warm.
Die Kontaktflächen habe ich nicht geschliffen. Hab einen molded die also die Kontaktfläche ist recht eben.
Als Wärmeleitpaste habe ich die Arctic MX-4 genommen.

Bin auch am Überlegen ob ich einfach jedesmal wenn ich zocken möchte oder compute tasks ausführen möchte einfach die Lüfter auf 85-90% laufen lasse.

Habe eben nochmal etwas in Linux die Einstellungen getestet und es scheint sie laufen noch nicht ganz stabil auch wenn unter Windows keine Probleme auftraten.
Wenn ich folgenden Deep Learning Benchmark auf der Karte laufen lassen stürzt die Karte nach 5minuten ab:
benchmarks/scripts/tf_cnn_benchmarks at master . tensorflow/benchmarks . GitHub
python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=32 --model=resnet50

Das praktische ist unter Linux kann ich jetzt mit dem Deep Learning Benchmark schneller die Einstellungen testen und muss nicht ewig mit Witcher 3 testen, ob die Einstellungen stabil sind.

Werde den HBM mal etwas runter setzen und testen. Der ging auch schon auf Windows nicht besonder hoch obwohl es Samsung HBM ist.
 
Weil Du ne 56 hast, brauchst Du net den HBM-P3 = GPU-P5 setzen.(das wäre nur bei der 64 so)
Reduzier mal auf 912mV. Evtl. reicht auch 906mV.
Das ist die Spannung vom SOC. Der dürfte dann kühler bleiben.

Standardmäßig ist bei der 56 der HBM-P2= GPU-P1 und der HBM-P3 = GPU-P2.
Deswegen würd ich auch GPU-P1=900mV lassen. Die 800mV bei Dir bringen vermutlich
keine Vorteile.(weil auf dem Desktop@2d eh nur State 0 genutzt wird)

edit: zugunsten der Stabilität könnte man die mittl. States noch anpassen.
(etwas gleichmäßiger)

edit2: P5-Takt
 

Anhänge

  • 56@M2.PNG
    56@M2.PNG
    731,9 KB · Aufrufe: 95
Zuletzt bearbeitet:
Habe mal zuerst versucht den HBM-P3 auf 912mV zu setzen. Wenn ich den HBM-P3 auf 900Mhz 912mV einstelle dann stürzt der Benchmark allerdings ab.
Im moment scheinen diese Einstellungen stabil zu laufen:
Code:
GPU[0]          : OD_SCLK:
GPU[0]          : 0:        852Mhz        800mV
GPU[0]          : 1:        992Mhz        900mV
GPU[0]          : 2:       1137Mhz        906mV
GPU[0]          : 3:       1252Mhz        912mV
GPU[0]          : 4:       1352Mhz        918mV
GPU[0]          : 5:       1412Mhz        975mV
GPU[0]          : 6:       1552Mhz        987mV
GPU[0]          : 7:       1632Mhz       1000mV
GPU[0]          : OD_MCLK:
GPU[0]          : 0:        167Mhz        800mV
GPU[0]          : 1:        500Mhz        800mV
GPU[0]          : 2:        700Mhz        900mV
GPU[0]          : 3:        900Mhz        950mV

Musste GPU-P7 um 10Mhz verringern und den HBM-P3 auf 900Mhz 950mV stellen. Ich werde mit der HBM-P3 Voltage nun versuchen schrittweise runtergehen.

Habe jetzt auch die Einstellungen des Referenzlüfters mit dem sensors tool in Linux gefunden. Der Referenzlüfter geht anscheinend von 400-4900RPM. Damit könnte ich dann versuchen eine Fancurve zu erstellen die von den 400-4900RPM der Referenzlüfter auf meine 200-1800RPM abgebildet wird.
Die junction temp scheint bei dem Benchmark auch höher zu liegen als mit dem Superposition. Superposition waren es 77°C und hier sind es 82°C.
Code:
amdgpu-pci-2800
Adapter: PCI adapter
vddgfx:      1000.00 mV 
fan1:        1664 RPM  (min =  400 RPM, max = 4900 RPM)
edge:         +49.0°C  (crit = +85.0°C, hyst = -273.1°C)
                       (emerg = +90.0°C)
junction:     +82.0°C  (crit = +105.0°C, hyst = -273.1°C)
                       (emerg = +110.0°C)
mem:          +51.0°C  (crit = +95.0°C, hyst = -273.1°C)
                       (emerg = +100.0°C)
power1:      188.00 W  (cap = 247.00 W)
 
Habe mal zuerst versucht den HBM-P3 auf 912mV zu setzen. Wenn ich den HBM-P3 auf 900Mhz 912mV einstelle dann stürzt der Benchmark allerdings ab.
Im moment scheinen diese Einstellungen stabil zu laufen:
Code:
GPU[0]          : OD_SCLK:
GPU[0]          : 0:        852Mhz        800mV
GPU[0]          : 1:        992Mhz        900mV
GPU[0]          : 2:       1137Mhz        906mV
GPU[0]          : 3:       1252Mhz        912mV
GPU[0]          : 4:       1352Mhz        918mV
GPU[0]          : 5:       1412Mhz        975mV
GPU[0]          : 6:       1552Mhz        987mV
GPU[0]          : 7:       1632Mhz       1000mV
GPU[0]          : OD_MCLK:
GPU[0]          : 0:        167Mhz        800mV
GPU[0]          : 1:        500Mhz        800mV
GPU[0]          : 2:        700Mhz        900mV
GPU[0]          : 3:        900Mhz        950mV

Musste GPU-P7 um 10Mhz verringern und den HBM-P3 auf 900Mhz 950mV stellen. Ich werde mit der HBM-P3 Voltage nun versuchen schrittweise runtergehen.

Habe jetzt auch die Einstellungen des Referenzlüfters mit dem sensors tool in Linux gefunden. Der Referenzlüfter geht anscheinend von 400-4900RPM. Damit könnte ich dann versuchen eine Fancurve zu erstellen die von den 400-4900RPM der Referenzlüfter auf meine 200-1800RPM abgebildet wird.
Die junction temp scheint bei dem Benchmark auch höher zu liegen als mit dem Superposition. Superposition waren es 77°C und hier sind es 82°C.
Code:
amdgpu-pci-2800
Adapter: PCI adapter
vddgfx:      1000.00 mV 
fan1:        1664 RPM  (min =  400 RPM, max = 4900 RPM)
edge:         +49.0°C  (crit = +85.0°C, hyst = -273.1°C)
                       (emerg = +90.0°C)
junction:     +82.0°C  (crit = +105.0°C, hyst = -273.1°C)
                       (emerg = +110.0°C)
mem:          +51.0°C  (crit = +95.0°C, hyst = -273.1°C)
                       (emerg = +100.0°C)
power1:      188.00 W  (cap = 247.00 W)

Beachte bitte das du bei den mV Angaben zum HBM im Wattman nicht dessen Spannung veränderst, sondern nur festlegst, wann der volle HBM Takt anliegen soll. I.d.R nimmt man hier die mV von GPU-P3. Da das bei dir aber nicht stabil läuft sollte hier der Hund woanders begraben sein.

Grüße


Gesendet von iPhone mit Tapatalk
 
Bei manchen Asus-Modellen ging der HBM-P3 auch net so niedrig.(quasi Fehlverhalten ala FE)
Das kann also auch mal vorkommen.
edit: die 56strix hat z.Bsp. auch eine ungewöhnlich hohe TDP von 260W
VGA Bios Collection: Asus RX Vega 56 8 GB | TechPowerUp
Da müsste man glatt mal nachschauen wie HBM-P2+3@default eingestellt sind.
Net das P2=950mV und P3=1050mV wie bei der 64 drin stehen.

Wäre daher gut, wenn silex mal sein Graka-Modell nennt.

Der Hinweis von Janni ist insofern für den Linux-Test zu beachten, weil bei sehr hoher HBM-P3>=950mV
der Takt ja immer erst zusammen mit nem rel. hohem GPU-State da war.
Kann sein das bei HBM@912mV mit niedrigem GPU-Takt+vollem HBM-Takt der Linux-Test eher instabil wird, weil
durch die höhere Bandbreite auch viel mehr Performance untenrum da ist.

Würde dann allerdings so ungefähr weiter testen:
(erstmal versuchen den HBM-P3= GPU-P3)
 

Anhänge

  • 56@M2.PNG
    56@M2.PNG
    732,1 KB · Aufrufe: 172
Zuletzt bearbeitet:
Habe die Einstellungen jetzt so vorgenommen allerdings gibts immer noch Abstürze.
Code:
GPU[0]          : OD_SCLK:
GPU[0]          : 0:        852Mhz        800mV
GPU[0]          : 1:        992Mhz        900mV
GPU[0]          : 2:       1137Mhz        912mV
GPU[0]          : 3:       1252Mhz        925mV
GPU[0]          : 4:       1352Mhz        937mV
GPU[0]          : 5:       1452Mhz        956mV
GPU[0]          : 6:       1552Mhz        981mV
GPU[0]          : 7:       1632Mhz       1000mV
GPU[0]          : OD_MCLK:
GPU[0]          : 0:        167Mhz        800mV
GPU[0]          : 1:        500Mhz        800mV
GPU[0]          : 2:        700Mhz        900mV
GPU[0]          : 3:        900Mhz        925mV

Ich habe diese Karte: VGA Bios Collection: ASRock RX Vega 56 8 GB | TechPowerUp
Default Einstellungen sind:
Code:
GPU[0]          : OD_SCLK:
GPU[0]          : 0:        852Mhz        800mV
GPU[0]          : 1:        991Mhz        900mV
GPU[0]          : 2:       1138Mhz        950mV
GPU[0]          : 3:       1269Mhz       1000mV
GPU[0]          : 4:       1312Mhz       1050mV
GPU[0]          : 5:       1474Mhz       1100mV
GPU[0]          : 6:       1538Mhz       1150mV
GPU[0]          : 7:       1590Mhz       1200mV
GPU[0]          : OD_MCLK:
GPU[0]          : 0:        167Mhz        800mV
GPU[0]          : 1:        500Mhz        800mV
GPU[0]          : 2:        700Mhz        900mV
GPU[0]          : 3:        800Mhz        950mV

Vielleicht sollte ich auf Linux doch nochmal mit dem niedrigen Setting für die Vega56 von Seite1 anfangen. Ich teste das niedrige Setting mal.
 
Setz mal GPU-P6 = 1522..1532 und P7 = 1612 und erhöhe den P7-Takt dann langsam.
Manchmal liegts net nur am P7, sondern auch schon am P6.

Wenn der HBM sehr schlecht wäre könntest Du auch mal noch auf 880 runter gehen.
Ist dann immer eine Abwägung ob man mehr GPU-Takt oder HBM-Takt stabil möchte.
 
Zuletzt bearbeitet:
@RX480 Danke dir für deine Hilfe.
Habe jetzt GPU-P6 = 1532 und GPU-P7=1622. Damit läuft es jetzt stabil.
Code:
GPU[0]          : OD_SCLK:
GPU[0]          : 0:        852Mhz        800mV
GPU[0]          : 1:        992Mhz        900mV
GPU[0]          : 2:       1137Mhz        912mV
GPU[0]          : 3:       1252Mhz        925mV
GPU[0]          : 4:       1352Mhz        937mV
GPU[0]          : 5:       1452Mhz        956mV
GPU[0]          : 6:       1532Mhz        981mV
GPU[0]          : 7:       1622Mhz       1000mV
GPU[0]          : OD_MCLK:
GPU[0]          : 0:        167Mhz        800mV
GPU[0]          : 1:        500Mhz        800mV
GPU[0]          : 2:        700Mhz        900mV
GPU[0]          : 3:        900Mhz        925mV
 
Werde den HBM mal etwas runter setzen und testen. Der ging auch schon auf Windows nicht besonder hoch obwohl es Samsung HBM ist.

Jetzt, wo der GPU-Takt stabiler ist, könntest Du den HBM vllt. nochmal neu ausloten.
Gabs schnell Artefakte ? Wenn ja, würde ich ca. 10MHz darunter einstellen.
Mit Heaven eigentlich rel. schnell sichtbar:
UNIGINE Benchmarks

Weiss jetzt allerdings net ob Dein Linuxtool schärfere Anforderungen an den HBM stellt.
 
Der neue Treiber Adrenalin 2020 wurde heute veröffentlicht und liegt zum Download bereit.
Dann wollen wir mal schauen, was der aus unseren Vega Karten rausholt. Angeblich ist der rückwärts kompatibel ab der 590er Reihe, sofern ich das so auf die Schnelle überflogen habe.
Wer will als erster dran? Bin mal gespannt wie das Menü für den Wattmann aussieht, dass habe ich bisher noch gar nicht gesehen. Eher die "general settings", wo unter anderem das neue Boost Feature hinzugekommen ist. Das Layout sieht nun schon mal ganz hübsch aus!
 
Man wartet anscheinend noch auf das WHQL signed von MS. Soll aber heute noch passieren.
Der Treiber soll als NEUINSTALLATION aufgespielt werden, net einfach drüberbügeln.

Die Performance in Games scheint sich für Vega net groß zu net zu ändern.(x)
AMD Radeon Software Adrenalin 2020 Driver Update, Boost & Performance Review | TechPowerUp
Wer allerdings VSR+RIS nutzt kann das dann auch in DX11 oder in ausgewählten Games das neue RadeonBoost.
Für Laptops ist das Integerscaling net schlecht.

(x) es werden wohl vor allem Schwächen von Navi in 1080p ausgemerzt.(sollte der 19.12.1 auch schon)

Da isser:
https://www.amd.com/en/support/kb/release-notes/rn-rad-win-19-12-2

edit:
Den MemTweaker würde ich mit dem Treiber erstmal net verwenden, weil man net weiss,
ob an der richtigen Stelle die Setting gespeichert werden.
Der Wattman sprang bei mir von Custom auf Standard.(x)

FRTC scheints auch net mehr in den Globalen Einstellungen zu geben.
ein User im guru3d-Forum
"FRT is gone, but we can edit it by Registry"
Spoiler: Tweak, i have 70FPS (ist sein 00000046)
"KMD_FRTEnabled"=dword:00000001
"KMD_MaxFrameRateRequested"=dword:00000046

(x) edit2: Kann sein das fürs Idle net mehr Lüfter <10% für die Ref. genommen werden kann.
 
Zuletzt bearbeitet:
Ich muss wohl auch nochmal ran ans tweaken bzw vielleicht ist es auch einfach ein Problem mit Borderlands 3.
War nun schon testweise mit dem HBM auf 920 und mit P7 auf 1602 runter, trotzdem schmiert Borderlands ab mit der Meldung:
"Video driver crashed and was reset". Er verliert zuvor dann auch oftmals das Monitorsignal. Das passiert auch mit dem neuen Treiber.
In anderen Titeln habe ich soweit keine Probleme.
 
Zuletzt bearbeitet:
1) Würde mich net wundern, wenns am fehlenden Fps-Limit liegt.
siehe oben

2) Wie das alternativ mit Chill "alleine" funzen soll ist mir noch net so richtig klar.
Einige Games sind ja schon immer ochsig beim Fps-Limit, wo dann nur Vsync hilft.
Die Frage wäre, was passiert mit Freesync+Vsync an bei Dir?
(gibts dann Tearing und funzt Freesync weiterhin normal)

3) Ich hatte nach der Installation auch mal den ShaderCache vom Treiber aus gelöscht.
Da waren einige Games am Anfang zickig bis es wieder normal ging.
(bin vorsichtshalber auch im Takt ein mue runter)
 
Zuletzt bearbeitet:
Zurück