NVIDIA Ada Lovelace Laberthread / RTX 40-Serie

Ich habe gestern mal einiges an Zeit investiert um zu schauen, wie die Skalierung der (meiner) RTX 4090 so aussieht. Ich habe mit verschiedenen Spannungen und Frequenzen herumexperimentiert. Dabei sind schlussendlich 4 unterschiedliche Profile herausgekommen, die ich mir abgespeichert habe:

Profil 1: 870mV | 2520MHz Chiptakt (2520MHz real unter Last) | +1700MHz VRAM-Takt
Anhang anzeigen 1406663

Profil 2: 935mV | 2715MHz Chiptakt (2700MHz real unter Last) | +1700MHz VRAM-Takt
Anhang anzeigen 1406664

Profil 3: 1000mV | 2895MHz Chiptakt (2880MHz real unter Last) | +1700MHz VRAM-Takt
Anhang anzeigen 1406665

Profil 4: Standardkurve; +240MHz Chiptakt (2970MHz unter Last) | +1700MHz VRAM-Takt
Anhang anzeigen 1406666

Verifiziert habe ich die Stabilität mit jeweils 20 Loops Port Royal, 20 Loops Speed Way. Zusätzlich habe ich noch eine halbe Stunde Quake 2 RTX in UHD + 150% Auflösungsskalierung laufen gelassen. (gibt quasi nix, was mehr stresst, belegt ~ 22GB VRAM).

Was soll ich sagen? Zwischen meinem "maximalen UV-Profil" und dem "maximalen OC-Profil" liegen keine 15% Leistungsunterschied. Das war bei meiner 3090 noch anders. Das schlägt sich sowohl in den Punkten in den genannten Benchmarks als auch in den FPS in den Games nieder (gemessen in Quake 2 RTX, da maximale GPU-Last):

Speedway:
Anhang anzeigen 1406670
9,8% Punktdifferenz

Port Royal:
Anhang anzeigen 1406671
11,5% Punktdifferenz

Time Spy Extreme:
Anhang anzeigen 1406672
12,1% (Grafik-)punktdifferenz

Quake 2 RTX:
Anhang anzeigen 1406673Anhang anzeigen 1406674
UHD (Powerlimit OC-Kurve)

Anhang anzeigen 1406675Anhang anzeigen 1406676
1680x1050 (um Powerlimit zu vermeiden) - 9,9% FPS-Differenz

Was sagt uns das schlussendlich? Lasst die Karte mit dem minimalsten Takt laufen, den sie annimmt bzw. stabil ist (bei mir 870mV) und holt bei dieser Spannung alles raus, was geht (ergo stabil ist) an Chiptakt und VRAM-Takt. So ist die Karte mega effizient und bringt fast Stock-Leistung. Man kriegt sie so quasi nicht über 350W Verbrauch, egal was man nimmt. In der Realität liegt der Verbrauch dann meist eher bei <300Watt, in weniger anspruchsvollen Engines/Games (z.B. Anvil Engine von Ubisoft ---> Assassin's Creed/Ghost Recon) sowieso DEUTLICH darunter!

Was mit diesen Einstellungen auf der 4090 nicht zufriedenstellend läuft, wird auch mit 10% mehr (an der Kotzgrenze laufende 4090) nicht zufriedenstellend laufen. Da bedient man dann halt die Regler oder zockt es auf der nächsten GPU, wenn man unbedingt maximale Bildqualität + FPS will. Weiterhin muss ich mir über die Belüftung und Temperaturen im Case überhaupt keine Gedanken mehr machen, was ich ja an meinem RTSS-Overlay gut sehen kann. Bis der Dreizack mit dem Cablemod-Kabel ausgetauscht ist, fühle ich mich auch "safe".

Fazit: Wer diese Karte "prügelt", (sorry, dass ich das so drastisch sage) ist einfach nur doof. Wir haben nun ein Leistungsrelief erreicht, wo das einfach nicht mehr nötig ist. Mit maximalem UV ist die Karte ein absolutes Effizienzwunder und wenn man das mit der Spannungsskalierung der RTX 3090 vergleicht, verliert man relativ gesehen auch nicht so viel Leistung!
Interessant wäre der Leustubgsvergleich, wenn du einfach das PT auf 350 watt runter drehst.

Verglichen mit deinen ZV Kurven

Der 8auer meinte in einem Video dass seine manuellen UV Versuche immer schlechter waren, als wenn man einfach den Powerlilit regler runtergedreht hat.
 
Interessant wäre der Leustubgsvergleich, wenn du einfach das PT auf 350 watt runter drehst.

Verglichen mit deinen ZV Kurven

Der 8auer meinte in einem Video dass seine manuellen UV Versuche immer schlechter waren, als wenn man einfach den Powerlilit regler runtergedreht hat.
Kann ich noch machen! Ich kenne das Video. Ich bin halt eher Fan von festen Spannungen.

Also quasi die Kurve einfach stock lassen, dann auch 1700MHz auf den VRAM (damit es vergleichbar ist) und PL bei 70% locken?:
1667213972449.png

Das nennt sich chiplotterie
Das kann gut gehen wird aber in Normalfall zu Instabilität führen der einfachste Energieeinsparung ist PT herabsetzen.
UV ist pures glück, den es haben Ingenieure das optimum geplant da ist ein kleiner raum für Optimierungen aber der ist heutzutage völlig Sinnfrei zu eruieren.
Stelle ich meine gpu (rtx3060) auf 75% Pt erreiche ich gerade 130w tbp von 170w tbp und verliere nur 1%
bei 60% PT sind es ganze -10 -15% und nur noch 100w
Das Problem ist das dies bei dxr sehr schmerzhaft ist.

Bei ner rtx4090 die von haus aus zu viel Strom zieht 450w sind illusorisch in games, ohne vram braucht der chip etwa 330w.
Sofern kein cpu limit anliegt. Was bei vielen aber so sein wird. Also eure Effizienz gewinne erkauft ihr euch durch eine zu schwache cpu.
Also wisst ihr gar nicht das die gpu bei Uv instabil wird.

Undervolting brachte was.
Das war mal früher so als noch kaum bis keine stromspar Mechanismen bei gpu gab. So 2008-2013 rum.

Ähnlich zu cpu ist OC oder UV bei gpu heute völlig Sinnfrei.
Man braucht nur einen slider bewegen. PT rauf runter und wie man bei rtx4090 sieht bringt das nix da man vcore limitiert ist.
Auch gut zum vergleich mehr vram Takt bringt oft mehr besonders in 3dmark.
Sagt aber auch das der benchmark nicht mit realen games benches zu tun hat.
Sorry, aber bitte lass' es einfach. Ist besser für alle, glaube ich. ^^
 
Kann ich noch machen! Ich kenne das Video. Ich bin halt eher Fan von festen Spannungen.

Also quasi die Kurve einfach stock lassen, dann auch 1700MHz auf den VRAM (damit es vergleichbar ist) und PL bei 70% locken?:
Okay, ich habe jetzt mal das PT bei 70% gelockt, was einem Verbrauch von 315W in Port Royal, Speed Way und Time Spy Extreme entspricht:

Speed Way:
1667215230410.jpeg

9422 Punkte (70% PT) < 9566 Punkte (870 mV UV-Profil)

Port Royal:
1667215324729.jpeg

23861 Punkte (70% PT) < 24190 Punkte (870 mV UV-Profil)

Time Spy Extreme:
1667215355573.jpeg

17977 Punkte (70% PT) < 18158 Punkte (870 mV UV-Profil)

Also man kann sehen, dass mein UV-Profil etwas mehr Punkte, leicht niedrigere Temperaturen und eine höhere (konstante) durchschnittliche Taktfrequenz bringt. Die Taktfrequenz beim 70% PT-Profil ist immer zwischen 2200 und 2400 MHz umhergesprungen, während bei meinem UV-Profil konstant 2520 MHz angelegen haben. Zudem lag der Verbrauch bei Port Royal, Speed Way und Time Spy Extreme bei unter 300 Watt (oft auch mal nur 270 Watt, je nach Last), während beim 70% PT-Profil durchweg 313-315 Watt angelegen haben.

Ich bevorzuge also ganz klar mein händisch optimiertes UV-Profil, da es mehr Leistung (vor allem eine konstante Taktfrequenz), kühlere Temperaturen und weniger Stromverbrauch bringt. Man muss auch im Hinterkopf behalten, dass man, wenn man mal ein Game zockt, was nicht so anspruchsvoll ist, trotzdem die 0.870V Spannung und die 2520MHz anliegen hat und dann wesentlich weniger Strom verbraucht, während das 70% PT-Profil die 315W immer ausreizt und dann entsprechend mehr Spannung und Takt draufgibt.

Ich muss aber vielleicht auch dazu sagen, dass ich z.B. auch bei CPUs einen manuell eingestellten Allcore-Takt einem festen Powerlimit vorziehe.

Quake 2 RTX: PT @ 78% um ~350W Verbrauch zu erreichen:
20221031124308_1.jpg

UHD: 75 FPS (78% PT) < 80 FPS (870mV UV-Profil)

1667217181587.jpeg

1680x1050: 296 FPS (78% PT) > 283 FPS (870mV UV-Profil)

Wie man sehen kann: In UHD ist das UV-Profil 5 FPS schneller/besser, da das PT-Profil runtertakten muss aufgrund der höheren Spannung. In 1680x1050 reizt das 78% PT-Profil die 350 Watt aus und liefert 13 FPS mehr bei 90 Watt mehr Verbrauch.
 

Anhänge

  • 1667216781680.png
    1667216781680.png
    158,1 KB · Aufrufe: 25
Zuletzt bearbeitet von einem Moderator:
Mich treibt der MSI Afterburner noch in den Wahnsinn. Ich glaube alle Tricks zu kennen mit der L Taste, dem Bereich markieren, den TAB, Shift und Strg-Tasten Kombinationen... Und dennoch hauts mir die Linie regelmäßig kaputt, oft nach dem Drücken von "Apply". Dieses Teil ist derart schrottig programmiert, ich krieg noch die Motten!!!!
Machst Du das im kalten Zustand der Karte? Wenn die Karte noch warm ist, spinnt das manchmal etwas rum und die Linie verrutscht (bei mir). Im kalten Zustand bleibt es so und die Profile werden korrekt übernommen/gespeichert.

Und über 3000 MHz kann man auch nix vernünftig einstellen :(
Das habe ich noch nicht probiert, weil ich ein 450W-Limit habe (Dreizack) und kann deshalb dazu nichts sagen.
 
Ein fester All-Core bei einer CPU ist doch pure Stromverschwendung!
Findest Du? Wenn ich im Windows unterwegs bin, habe ich meine CPU eh nur auf 50% laufen:
1667217715035.png

Dann zieht die ihre 13-14 Watt. Wenn ich zocke, drehe ich einfach auf 100% und gut ist. Passt für mich so. ^^
Das Problem tritt auf, wenn man die Linie editiert und dann "Apply" drückt. Da passieren die lustigsten Dinge.

Auch die dünne Vergleichslinie, die eigentlich die ooTB Kurve anzeigen soll, ist völlig kaputt in der Version. Meines erachtens funktioniert die aktuelle AB nicht richtig mit AL.
Ich habe tatsächlich keine Probleme, bei mir passt alles. :huh:
 
Und ich hab im Idle i.d.R. weniger als 10Watt. Nicht die Welt, aber dafür idlet man ja auch den Großteil der Zeit.

Man MUSS Automatiken nicht auf Teufel komm raus deaktivieren. Die haben schon ihren Sinn.
Ja gut, Du hast ja auch eine moderne CPU mit mehr IPC und höherer Effizienz. :D

Ich habe noch 'ne olle 14 nm Skylake-Architektur. ^^
Ich sehe aber immer noch keinen Grund zum Wechsel, da ich in meinen Games selbst mit der 4090 noch im GPU-Limit bin. ^^
 
"out of the Box". Also die Kurve wenn man auf "Default" stellt. Die wird normal immer zum Vergleich als dünne Linie mit angezeigt.
Ah, okay. Das kann sein. Da habe ich noch nicht drauf geachtet.

Ansonsten: Ich bin jetzt aber auch erstmal fertig mit dem AB. Ich habe jetzt mein Profil und bin damit zufrieden. Wenn es mit den 870 mV/2520 MHz mal einen Crash geben sollte, geht es halt 5mV hoch oder 15 MHz runter. :)

Ich wollte auch nur meine Erfahrungen teilen. Kann am Ende jede(r) machen, wie er/sie möchte. :)
 
Zuletzt bearbeitet von einem Moderator:
Ich hatte vor kurzem ja einen echt lauten und heißen Heizstrahler PC.

Die Lösung war Undervolting der CPU um 100mV.
( Advanced Offset Mode minus 0.1 falls das jemand probieren möchte )
Dazu läuft ein XMP Profil für den RAM und die GPU mit 2880MHZ bei 1000mV.
Memory Clock habe ich bisher nur um 100MHZ angehoben.

Jetzt rennt die Kiste stabil, leise, kühl und hat Leistung satt.
 
Aber eher weil sich herausgestellt hat, dass mein Board ne Macke hat (es gehen nur 2 Lanes des PCIe GPU Slots - und das hab ich ewig gar nicht bemerkt) und ich eh alles austauschen muss.
Ist doch optimal. So tut sich durch das CPU Upgrade tatsächlich was an der GPU Leistung :D

Ich habe mir nach dem Versuch mit dem PG32UQX auch einen neuen Monitor gegönnt. Den AW3423DW, also endlich auch OLED am Schreibtisch. Der Sprung zum PG32UQX in der subjektiven Bildqualität ist echt abnormal. Der bleibt definitiv, wenn ich keinen Pixelfehler oder so finde. Um Burn In muss ich mir die ersten 3 Jahre auch keine Sorgen machen, da gibt Dell Garantie drauf und nach den 3 Jahren gibt es hoffentlich endlich Micro LED Monitore.
 
Ich wollte auch nur meine Erfahrungen teilen.
...und das ist toll! Ich habe auch ein paar solcher Tests gemacht, bin dann aber nicht mehr dazu gekommen, sie zu posten. Ich testete 80, 70 und 65% Powerlimit vs. UV 2520 MHz bei 875 mV. Sieger in Puncto Effizienz war das UV (2,1 FPS/10W) knapp vor dem 65% Powerlimit (1,94FPS/10W).
Der FPS Verlust war aber mit UV am höchsten, etwa 5 FPS. Aber damit kann ich leben, denn Stromverbrauch und Temperaturen waren auch am niedrigsten. Deshalb wird das mein Alltags-Setting bleiben. Die Temperaturen waren allerdings auch im Standard-Betrieb völlig unbedenklich, selten habe ich mal die 80° gesehen.
Getestet habe ich mit dem Metro EE-Benchmark und dem internen Benchmark von CP2077.
Damit die Karte auch was zu tun hat, habe ich 1,78xDLDSR von 3440x1440 als Auflösung gewählt.
 
...und das ist toll! Ich habe auch ein paar solcher Tests gemacht, bin dann aber nicht mehr dazu gekommen, sie zu posten. Ich testete 80, 70 und 65% Powerlimit vs. UV 2520 MHz bei 875 mV. Sieger in Puncto Effizienz war das UV (2,1 FPS/10W) knapp vor dem 65% Powerlimit (1,94FPS/10W).
Der FPS Verlust war aber mit UV am höchsten, etwa 5 FPS. Aber damit kann ich leben, denn Stromverbrauch und Temperaturen waren auch am niedrigsten. Deshalb wird das mein Alltags-Setting bleiben. Die Temperaturen waren allerdings auch im Standard-Betrieb völlig unbedenklich, selten habe ich mal die 80° gesehen.
Getestet habe ich mit dem Metro EE-Benchmark und dem internen Benchmark von CP2077.
Damit die Karte auch was zu tun hat, habe ich 1,78xDLDSR von 3440x1440 als Auflösung gewählt.
Cool, danke für die Infos! Ja, wenn man einfach nur ein Powerlimit verwendet (ohne die Kurve anzufassen), dann gibt die GPU natürlich wesentlich mehr Spannung drauf als dafür eigentlich nötig wäre bzw. als wenn man es halt manuell auslotet. Dadurch gewinnt man dann beim manuellen UV die Effizienz. :)
Und ich meine irgendwo gehört zu haben, dass der interne GPU Video Clock, auf den man nur indirekt einen Einfluss hat, dann nicht so hochtaktet.

Hattest Du den Leistungsverlust von 5 FPS in Cyberpunk und Metro? Ich konnte das nämlich in den 3DMark Benchmarks und Quake 2 RTX nicht feststellen, wie gezeigt. In weniger leistungsintensiven Spielen gewinnt man dann bestimmt mehr FPS gegenüber dem UV-Profil, weil die GPU dann halt bis zum eingestellten Powerlimit hochtakten kann bzw. es auslastet.

...Aber ja, wie gesagt: 5 FPS hin oder her machen den Braten nicht fett.
Weil ich so einen krassen Pile of Shame habe und viele Spiele aus den letzten Jahren nachhole, habe ich da eh mehr als genug FPS. ^^
 
Zuletzt bearbeitet von einem Moderator:
Wieviel Watt spart man denn im Vergleich zur PT Reduktion?
Das ist von der Lastintensität der jeweiligen Engine vom Spiel abhängig und ob z.B. Raytracing genutzt wird oder nicht.

In manchen Spielen gar nichts (aber dafür mehr FPS), in manchen Spielen sind es 20-30 Watt. Es können aber auch über 100 Watt sein (bei der Anvil Engine z.B.: habe es in Assassin's Creed Odyssey getestet, dafür dann natürlich ein paar FPS weniger). Komplett unterschiedlich.

Wenn man immer gleich viel verbrauchen will und einem Lastschwankungen egal sind, dann ist natürlich PT-Reduktion das Mittel der Wahl. Hat alles seine Vor- und Nachteile. :)
 
so hier mal in die ganz andere Richtung ! OC mit Anschlag

1667253247022.png




1667253284878.png



1667253326222.png



1667253365891.png



1667253396366.png
 
Ist doch optimal. So tut sich durch das CPU Upgrade tatsächlich was an der GPU Leistung :D

Ich habe mir nach dem Versuch mit dem PG32UQX auch einen neuen Monitor gegönnt. Den AW3423DW, also endlich auch OLED am Schreibtisch. Der Sprung zum PG32UQX in der subjektiven Bildqualität ist echt abnormal. Der bleibt definitiv, wenn ich keinen Pixelfehler oder so finde. Um Burn In muss ich mir die ersten 3 Jahre auch keine Sorgen machen, da gibt Dell Garantie drauf und nach den 3 Jahren gibt es hoffentlich endlich Micro LED Monitore.
Was hat dir am PG32UQX nicht gut gefallen? Ich finde den Monitor bis auf den Preis ziemlich interessant.
 
Zurück