AMD Radeon BigNavi & RDNA2 Laberthread

@Duvar hast du unter Win11 auch erlebt, dass im TS die GPU nur zu 60-70% ausgelastet wird? Ist bei mir so. Dann komme ich am Ende auf durchschnittliche 70 FPS statt einiges über hundert. Ist aber nur beim Benchen so. Beim Zocken habe ich volle Auslastung mit entsprechenden FPS.
 
@Duvar hast du unter Win11 auch erlebt, dass im TS die GPU nur zu 60-70% ausgelastet wird? Ist bei mir so. Dann komme ich am Ende auf durchschnittliche 70 FPS statt einiges über hundert. Ist aber nur beim Benchen so. Beim Zocken habe ich volle Auslastung mit entsprechenden FPS.

Teste mal was passiert wenn du die TDC erhöhst. Manchmal wird das PL das man einstellt nicht erreicht, wenn die TDC zu gering gewählt wurde, womöglich ist das bei dir der Fall, aber ansonsten wüsste ich nicht auf Anhieb das Win11 da gebockt hätte. Hab ja mittlerweile wieder Win 10.
 
Wenn Vsync oder Freesync noch an ist, kanns auch soo komisch laufen. (Fps-Limit/Chill dito)
evtl. mal unter Gaming das 3dMark+TS-Profil rausschmeissen.
in Global sauber einstellen
Und beim nächsten Mal 3dMark gibts dann ein neues korrektes Profil unter Gaming speziell für TS.
 
@Duvar

Schon mal Mem underclocked? :D



OpenCL Bench
Anhang anzeigen 1371434

SotTR Vergleich

2126MHz
Anhang anzeigen 1371436

1800MHz
Anhang anzeigen 1371435

Einfach den max MemClock auf 0900 und den DPM3 State ebenfalls auf 900 einstellen, dann bleibt das ding bei 1800MHz (und du könntest mit dem Speicher Undervolting eventuell noch mehr einsparen um Power dem Chip zukommen lassen).
Mit langsameren Speicher mehr Fps, interessant. Scheint an den scharfen latenzen dann zu liegen wenn ich das richtig sehe.
 
Schon mal Mem underclocked? :D
Anhang anzeigen 1371433
Einfach den max MemClock auf 0900 und den DPM3 State ebenfalls auf 900, dann bleibt das Ding bei 1800MHz.
I like your Inspirations!

Langsam mutiert der Desktop zum HTPC. (gerade die nonXT hat ja eh nen langsamen fclk, why not SOC+Vram@low)
Diesmal ohne irgendwelche Tweaks bei LD+SVO+TDV und auch maxGFX net gecappt.
Nur Tweak bei SOC-takt@970>>Vram@low956, wie von Darkearth vorgeschlagen. Juhu, der PC startet noch!
(MemoryTimingControl=1 im Overdrive)


edit: dummerweise war beim Run noch chill@57fps aktiviert und Das, nachdem ich gerade heute erst bei tekkla@TS
auf das Nähmliche hingewiesen hatte. (F1 sitzt immer davor)
edit2: mit Chill=Off sinds dann 6453Points.(ohne extra Bild)

Ggü. Stock gibts kaum Verluste, etwa 100Points=1,5% weniger, nur mit mehr Vram-OCen@FT kann man dann net mehr mithalten.
Die alten Ergebnisse waren hier:
 

Anhänge

  • 2569-500_DPM3=956.png
    2569-500_DPM3=956.png
    1,1 MB · Aufrufe: 33
  • DPM3@956MHz.jpg
    DPM3@956MHz.jpg
    294,9 KB · Aufrufe: 18
Zuletzt bearbeitet:
Mit langsameren Speicher mehr Fps, interessant. Scheint an den scharfen latenzen dann zu liegen wenn ich das richtig sehe.
Uups. ich hatte noch zuviel Vramtakt eingestellt.
Hast Recht, der eff.Takt muss evtl. unter 1800 sein.

edit: bringt NIX, war dann wieder langsamer als eff.1900

Am Besten läufts in der Nähe von Stock, ...mal SOC=1003+DPM3=992 nachgetestet:
(Timing 1 im Overdrive, aber net im WM aktiviert, ...k.A. ob Das noch Was bringen tät)
 

Anhänge

  • DPM3@992MHz_SOC1003MHz.jpg
    DPM3@992MHz_SOC1003MHz.jpg
    898,9 KB · Aufrufe: 22
Zuletzt bearbeitet:
@Gurdi

Ich würde behaupten, es wären zwei Sachen die da greifen.

Durch die schärferen Timings und dem geringeren Mem Use von SotTR hat der GPU Chip mehr Reserve und kann den Takt höher halten.

TimeSpy ist da ähnlich, verliert man im GT1 noch 2 FPS, ist es im GT2 ein FPS mehr, also auch nicht Memory abhängig.

Man sieht aber dann schön in Memory abhängigen Szenarien, dass es langsamer ist (deswegen neben dem Game Bench auch Open CL Benchmark).

Mal schauen ob ich das weiter nutzen werde, denn eigentlich sollte man ja annehmen, dass ein höherer Memtakt wie bei den CPUs auch, besser ist als scharfe Timings (beides zeitgleich geht ja leider oft nicht durch den Fallback oder weil die ICs es nicht können -> FT2)

So, gerade nochmal mit FH4 (Maxed Out in 1440p) getestet.



Hwinfo Log ist auch vorhanden, falls ihr vergleichen wollt, ist im Anhang.
 

Anhänge

  • FH4 2126MHz VRAM.zip
    28,4 KB · Aufrufe: 2
Zuletzt bearbeitet:
@Gurdi Danke, dir, hatte bislang kaum Zeit, aber ich schau mir das mal an, mit der neuesten Beta hatte ich es tatsächlich noch nicht versucht...das wäre ja ULTRA-GEIL <3 Ich poste dann Ergebnisse <3

Update: I kann zwar per MPT Overdrive einstellen, im Treiber werden die Settings aber nicht akzeptiert. Per AB kann ich den Memory clock erhöhen, allerdings ist der GPU-Clock dann stuck @450Mhz, gleiches Spiel, wenn ich den Memory per MPT auf 1025 erhöhe (also effektiv 2050), wobei das gleiche für jedes Setting über Stock gilt. Schade, schade :D

Update2: Ja, führt kein Weg rein, egal was ich im MPT einstelle. War bei RDNA2 am Anfang nicht auch diese Blockade drin was Mem angeht bzw ist es noch wenn man Mem zu hoch einstellt?
 
Zuletzt bearbeitet:
So, gerade nochmal mit FH4 (Maxed Out in 1440p) getestet.
... danke für das log.file, habs mal angeschaut (grün 2150 vs. rot1800)

Sieht so aus, als ob FH4 sehr gut mit den scharfen Latenzen kann, ... der MemoryController ist höher ausgelastet!
Ansonsten sehe ich vor Allem einen großen Unterschied beim eff.GFX-Clock, der u.U. auch an der Temp. hängt.
Bei längerem Spielen ohne Fps-Limit wirds wohl dann mit der Zeit langsamer mit dem 1800er.


edit: habe mal noch ein eher 24/7-taugliches Setting bei Gravity getestet. Statt WM 950mV jetzt 947mV bei
2MHz weniger maxTakt und aktivem SVO, um die SOC-Spannung zu drücken. ( b= 150 statt 171, c= dann entspr. kleiner)
(kann Zufall sein, aber bei nur kurz hinkucken scheint 950mV bei gleichem maxTakt im WM nen höheren eff.Clock zu haben, ...also Wer keine Probleme mit Temp+W hat, Der kann..)
 

Anhänge

  • DE-FH4.jpg
    DE-FH4.jpg
    201 KB · Aufrufe: 25
  • DPM3@992MHz_SOC1003MHz.jpg
    DPM3@992MHz_SOC1003MHz.jpg
    623,4 KB · Aufrufe: 20
Zuletzt bearbeitet:
Bei solchen Benchmarks, wo jedes Frame einzeln gezählt wird, sind schon 5-10MHz Unterschied bei
nuuur 2000MHz abrechenbar. (ca. 2 Watt weniger bei Vram sind halt auch net viel für die GFX zusätzlich)

Beim Spielen natürlich net sooo bemerkbar.

Bezgl. Temps, habe ich als Air-Purist natürlich net soviel Ahnung, ob in der Nähe von Hotspot <<60°C
sich Unterschiede auftun.
Es war für mich nur erstaunlich, wie gut die LC von Gurdi mit LM dann abging.
(und bei TDV steht auch nochmal 60 beim SOC drin, k.A. obs überhaupt zum STEUERN vom Treiber
benutzt wird)
 
Zuletzt bearbeitet:
Also ich bin aktuell total begeistert davon, dass man über das MPT mittlerweile die Speicherspannung senken kann. Der Speicher meiner 6900 war eh nicht wirklich taktfreudig und hat stabil knapp 2100 MHz mitgemacht.
Da die Karte eh sehr sparsam läuft (max GFX-Voltage auf 850mv) hab ich nun auch sukzessive die Speicherspannung reduziert und die Ergebnisse sind der Hammer!

Eine Reduktion auf 1175 mv resultiert weiterhin in einem stabilen Takt über 2000 MHz bei Fast-Timings.

Und Stromverbrauch und Temperatur sind gut runter. Gemessen hab ichs beim Mining mittels Hwinfo. Der Verbrauch lag bei 1350 mv bei etwa 70 und bei 1175 mv bei etwa 30 Watt.
 
Net schlecht, Das beruhigt mich total bei 1,262V/0,681V@MemScaling=off!
Geh mal noch beim SOC auf ca. 825mV runter, ggf. 831mV, um fehlerfrei zu bleiben fürs Minen.

... wäre die Frage, ob überhaupt weniger Watt bei Mem vom Core genutzt werden können?
(weil separate Spawas, ....dito SOC+fclk, wo Darkearth noch ala Duvar Potential hätte)

Bei DE@FH4 siehts erstmal net so aus!
(der Core selbst kann net, die mehr freigewordenen 8-10 Watts beziehen, ... liegt wohl doch an der Temp
und /oder die meeehr MemoryControllerAktivität kostet Ihren Preis, ...könnte uclk sein!?)


Auf jeden Fall können in der Richtung mit weniger Volts die AirGrakas kühler/leiser werden.
 

Anhänge

  • DE-FH4_Watts.jpg
    DE-FH4_Watts.jpg
    203,8 KB · Aufrufe: 20
Zuletzt bearbeitet:
Hab das ganze dann nochmal durch TS gejagt.. diesmal mit dem 24k Profil.. da fehlen dann 700 Punkte, weil GT1 ca. 8 FPS verliert mit nur 1800MHz Vram Takt.

Dennoch interessant, da die Leistungsaufnahme um knappe 50w niedriger war (laut Lutsch-o-meter an der Wand)
Also Leistung verlieren (ein wenig) und dafür aber 55w einsparen (ist ja nichtmal optimiert wegen SoC Voltage usw, hatte ich alles nicht angefasst, nur den MemClock und dessen Voltage) ist schon ok.

Klar kommt es immer drauf an was man macht. Spiele haben fast alle etwas mehr Leistung gehabt.
Die, welche ich getestet habe, reagierten also positiv auf die scharfen Timings -> FH4, SotTR, D3, TD2 -> wenn der Mem mit weniger läuft.

Timespy wie oben bereits erwähnt verliert besonders im GT 1 Leistung (tessellation, particle shadows usw)
während die Berechnungen von ray-marched volumetric illumination (kleine Partikel, Licht usw) vom VRAM unbeeindruckt sind.

Open CL bescheinigt dann den Verlust von Leistung auch ganz klar, wenn man den GPU RAM Test macht.

open CL bench VRAM.jpg

Bei mir sind sogar 2150MHz dann auch gleich den 2126MHz die ich immer einstelle. auch eine Erhöhung der MemVoltage im DPM3 hilft da nicht wirklich weiter (bin bis 1400mv hoch gegangen) Ergebnis sieht man dann oben im Bild.

Halten wir fest:

Wer seine karte noch weiter in der Leistungsaufnahme drücken will, kann beim Speicher dann doch noch etwas rausholen, Spiele sind nur wenige von Leistungseinbußen betroffen, Mining oder auf VRAM ausgelegte Workloads verlieren dann wohl etwas an Leistung.

Das waren so meine Beobachtungen die letzten 2 Tage. Wie sich das z.B. in Battle Royale Games wie Apex, COD usw verhalten würde habe ich nicht getestet, da mir Warzone auf den Sack geht und APEX ist halt.... naja APEX eben :D
 
Zuletzt bearbeitet:
Also ich bin aktuell total begeistert davon, dass man über das MPT mittlerweile die Speicherspannung senken kann.
Eine Reduktion auf 1175 mv resultiert weiterhin in einem stabilen Takt über 2000 MHz bei Fast-Timings.
it works = 1+

Mal über längere Zeit in Games beobachten.

edit: mal noch die kompletten Settings für Gurdi zum Testen
 

Anhänge

  • DPM0@1,175V.jpg
    DPM0@1,175V.jpg
    477,6 KB · Aufrufe: 19
  • LD87.png
    LD87.png
    1 MB · Aufrufe: 19
Zuletzt bearbeitet:
Update2: Ja, führt kein Weg rein, egal was ich im MPT einstelle. War bei RDNA2 am Anfang nicht auch diese Blockade drin was Mem angeht bzw ist es noch wenn man Mem zu hoch einstellt?
Ja derHandshake schiebt da dann einen Riegelvor,schade. Dukannst abermal schaun ob du an den Nebenwerten optimieren kannst,Spannung sollte sich z.B.senken lassen etc.
 
@Gurdi du meinst SOC-Spannung etc? Naja, das Display wird eh über die IGP angesteuert, daher kann ich eigentlich nicht wirklich was kaputt machen. GPU-Spannung anpassen per MPT kommt mir aber trotzdem spanisch vor :D
 
Zurück