Netztteil nicht mehr ausreichend?

-Loki-

Freizeitschrauber(in)
Hallo zusammen.

Ich habe seit dem Einbau meiner neuen GPU probleme mti dem PC die ich nicht zu 100% zuordnen kann.
Aber erstmal die Specs:
  • 3900x auf Crosshair VIII Formular mit 32GB RAM
  • Asus Prime RTX 5070Ti OC
  • be quiet! Straight Power 11 750Watt (2019)
Problem 1 ist, dass ich sporadich freezes oder Blackscreen bekomme. Das ist relativ selten aber bis jetzt immer nur wenn eigentlich keine große Last auf dem System ist. z.B. YouTube.

Das zweite Problem ist weitaus nerviger, aber durchaus reproduzierbar. Und zwar geht die CPU in einen 550MHz Failsave-Modus beim zocken. Aber nicht bei 100% GPU-Last, sondern dann wenn die Framerate schwankt. Aufgefallen war mir das zuerst in Kingdom Come Deliverence. Dort konnte ich es durch ein 60FPS-Limit soweit unterdrücken das es nur noch aufgetreten ist wenn viele NPCs auftreten und dadurch die Frames auch wieder einbrechen bzw schwanken. Star Citizen ist auch ein gutes Mittel dieses Verhalten zu triggern.
Hier hilft dann auch nur den PC komplett stromlos zu machen. Bei einem neustart bleibt die CPU weiterhin auf 550MHz gelocked.

Zuerst hatte ich natürlich die GPU in verdacht, aber die Fehler passen so überhaupt nicht zu einem GPU Defekt.

Aber wenn ich das richtig verstanden habe kann dieser Failsave durch unzureichende Spanungsversorgung ausgelöst werden.
Dadurch bin ich dann auf folgenden Idee gekommen.
Könnte es sein, dass das NT durch die kurzen extremen Leistungsspitzen die Spannung nicht mehr so sauber halten kann und es deshalb zu dem Lock kommt? Theortich sollte das NT genug Leistung haben, aber immerhin stammt es noch aus der Zeit bevor es diese extremen Lastspitzen gab.
Und wie gesagt es ist nur eine Idee von mir und würde auch nur das 2te Problem plausibel machen.

Was ist eure Meinung dazu. NT nicht mehr ausreichen oder verschlissen oder doch ein andres Problem?
 
Geht dein PC unter Last aus? Nein?
Dann ist es zu 99,9% nicht das Netzteil schuld.

Aber wenn ich das richtig verstanden habe kann dieser Failsave durch unzureichende Spanungsversorgung ausgelöst werden.
Nein. Bei zu wenig Spannung geht der PC aus weil die Undervoltageprotection des Netzteiles es abschaltet.

Könnte es sein, dass das NT durch die kurzen extremen Leistungsspitzen die Spannung nicht mehr so sauber halten kann und es deshalb zu dem Lock kommt?
Nein. Für solche Lastspitzen hat dein Netzteil große Primärkondensatoren und kann für kurze Zeiträume viel mehr als die Nennleistung liefern (das war bei guten NTs auch 2019 schon so, nur noch nicht verpflichtend in der ATX-Norm). Dein NT ist aber so groß dass es die nie benutzen muss. Ein 3900X mit 5070Ti kann keine 750W erreichen. Auch nicht nur kurz.


Freezes und Blackscreens usw. sind Anzeichen von Instabiler Hardware. Der Grund kann vieles sein. Zu viel OC oder ganz simpel Verschleiß beispielsweise. Ein defekter RAM-Riegel kann hier genauso der Grund sein wie ein aktives PBO im Bios oder ein OC der 5070er das zu hoch ist. Es ist auch nicht völlig unmöglich dass das NT sowas auslöst aber wie gesagt das ist der bei weitem unwahrscheinlichste Grund.
Dass du auch freezes ohne Last hast macht das NT (das da gar nichts leisten muss) noch viel unwahrscheinlicher. Sowas ist eher Variante "kaputter RAM-Riegel".
 
Geht dein PC unter Last aus? Nein?
Dann ist es zu 99,9% nicht das Netzteil schuld.


Nein. Bei zu wenig Spannung geht der PC aus weil die Undervoltageprotection des Netzteiles es abschaltet.


Nein. Für solche Lastspitzen hat dein Netzteil große Primärkondensatoren und kann für kurze Zeiträume viel mehr als die Nennleistung liefern (das war bei guten NTs auch 2019 schon so, nur noch nicht verpflichtend in der ATX-Norm). Dein NT ist aber so groß dass es die nie benutzen muss. Ein 3900X mit 5070Ti kann keine 750W erreichen. Auch nicht nur kurz.


Freezes und Blackscreens usw. sind Anzeichen von Instabiler Hardware. Der Grund kann vieles sein. Zu viel OC oder ganz simpel Verschleiß beispielsweise. Ein defekter RAM-Riegel kann hier genauso der Grund sein wie ein aktives PBO im Bios oder ein OC der 5070er das zu hoch ist. Es ist auch nicht völlig unmöglich dass das NT sowas auslöst aber wie gesagt das ist der bei weitem unwahrscheinlichste Grund.
Dass du auch freezes ohne Last hast macht das NT (das da gar nichts leisten muss) noch viel unwahrscheinlicher. Sowas ist eher Variante "kaputter RAM-Riegel".
Ich entschuldige ich schon mal vorab für den jetzt sehr langen Text, aber ich glaube er ist nötig, um etwas Kontext zu schaffen wie ich überhaupt auf die Idee gekommen bin, dass die PSU etwas damit zu tun haben könnte.

All diese Gedanken habe ich auch gehabt. Mir war das Anfangs, nach dem Wechsel, auch noch gar nicht aufgefallen da es nicht aufgetreten ist.

Und ich habe so gut wie möglich versucht alle potenziellen Fehlerquellen zu eliminieren bzw. auszuschließen. Ich liste gerne mal auf was ich alles so probiert bzw. getestet habe. Eventuell sieht jemand was, was ich nicht sehe.

Als erstes die GPU, auch wenn ich nicht wüsste, wie diese dieses Verhalten auslösen sollte. Vor allem das mit dem hardlocked Failsave auf 550MHz. Aber das war ja der einzige Faktor, den ich geändert habe.

Anfangs liefen Dutzende 3DMark Läufe und FurMark Stresstests. Hier nicht im Zuge der Fehlersuche aber um halt das OC-Potential und den Sweetspot zu finden. Auch habe ich diverse Games ohne den Hauch eines Problems (Alles immer im GPU-Limit oder auf 165FPS bzw. so nah wie möglich daran gelockt.) zocken können.

RAM habe ich sowohl mit Windows überprüft sowie auch 5 Stunden in MemTest86 Laufen gehabt. Null Fehler

CPU habe ich in etlichen CineBenchläufen, Burnins, Stresstests so gut wie möglich überprüft, ohne ein Fehler zu triggern.

Ich habe auch mehrere BIOS-Versionen getestet und auch diverse Einstellungen wie PBO aus usw.

Also habe ich dann erstmal die Freezes ausgeklammert, da diese nur sehr selten auftreten, und die gab es auch schon vorher schonmal, aber in einer Frequenz wo diese unbedeutend für mich waren.

Also habe ich mich dann auf den 550MHZ-Lock konzentriert und habe rausgefunden, wie ich ihn auslösen kann bzw. was die Bedingungen sind, um ihn zu triggern.

Wie ich schon erwähnte ist es mir zuerst in Kingdom Come Deliverance aufgefallen. Was bekanntlich echt nicht gut optimiert ist und man eigentlich immer im CPU-Limit hängt. Dort ist es anfangs vollkommen zufällig aufgetreten. Bis ich ein Muster erkannt habe. Und zwar trat es immer auf, wenn die Framraten stark geschwankt haben. Nicht immer sofort aber mit hoher Wahrscheinlichkeit. Ein oder zweimal hat es auch beim Wechsel von 30FPS Cutscene zum Spiel zurück getriggert. Also hatte ich eine Spur, die verfolgen konnte. Nach diversen Versuchen habe ich die FPS auf 60 begrenzt. Die 60 habe ich gewählt, weil ich keine Framdrops unter 65-70 FPS gesehen hatte. Und das Problem war weg.

Nicht weg, aber ich habe das Symptom beseitigt. Dachte ich zumindest, weil unter gewissen Bedingungen (viele Gegner und oder nachts) hate ich wieder Framedrops auch unter 60FPS. Im worst Case runter auf 45FPS. Und ich hatte wieder Locks auf 550MHz.

Dasselbe verhalten kann ich auch in Star Citizen und DCS reproduzieren. Es tritt nicht zwingend sofort auf aber nach einer Weile wird es auftreten. Beides wieder Spiele die primär CPU-Limited sind. Also scheinen offensichtlich die Schwankungen der FPS den Fehler zu einer gewissen %-Zahl zu triggern. Und ich glaube, ohne es belegen zu können, je höher die Schwankung, desto größer die Wahrscheinlichkeit.

Basierend auf diesen Erkenntnissen habe ich mir dann meine Gedanken zur potenziellen Ursache gemacht.

Erster Gedanke war erstmal CPU, aber da ich dieses Verhalten der CPU mit nichts anderen Triggern kann bis dato, und es schon ein großer Zufall wäre das sie genau mit Wechsel der GPU die Grätsche macht, hmm ich weiß nicht so recht.

OK, jetzt könnte man sagen, dass das Problem vorher schon da war und jetzt erst durch die neue GPU sichtbar wurde, aber da bin ich jetzt noch nicht so ganz von überzeugt, da ich alles drei vorher schon im CPU-Limit gespielt hatte und zu mindestens einmal dieses Problem dann hätte auftreten müssen.

Also habe ich angefangen zu recherchieren was diesen Failsave-Lock auslöst. Dinge wie PROCHOT konnte ich ausschließen. Aber ein Auslöser ist auch Unstimmigkeiten der CPU-Spannungsversorgung. Meine erste Reaktion war auch zu denken, dass das nicht sein kann, weil ja UVP ein Abschalten triggern müsste.

Also habe ich mir die technischen Daten vom Straight Power 11 besorgt, einfach weil ich wissen wollte, wann die PSU wirklich abschalten würde. Der Supervisor-IC ist ein WT7527, dieser triggert UVP wohl typicherweise zwischen 9,5 und 10,4V mit einer Reaktionszeit von 40-80μS. Da sehe ich schon die Möglichkeit für Spannungseinbrüche ohne direktes triggern von UVP.

Wenn ich jetzt noch davon ausgehe das die PSU nach knapp 6 1/2 Jahren und einer Betriebszeit von ca. 13000-15000 Stunden durchaus Spuren von Degeneration aufweisen kann. Kann ich mir zu mindestens vorstellen, dass es zu Spannungseinbrüchen auf der 12V-Schiene kommen kann.

Ob das jetzt wirklich ausreicht, um die VRM vom MB dazu zu bringen selbst eine Schutzmachnik auszulösen oder der CPU eine außerhalb der Spec. befindliche Spannungsversorgung zu melden, oder dadurch VCore selbst soweit einbricht, um eine Schutzebene in der CPU zu triggern kann ich natürlich nicht mit Bestimmtheit sagen.

Aber es ist zumindest eine Theorie, die mir in den Sinn kam.

Denkbar wäre auch, dass das MB bzw. dessen VRM einen weghat. Aber auch hier wäre es wieder Zufall das es zeitlich mit dem Tausch der GPU zusammenfällt und es vorher nie ein Problem gab.
 
Hmm, also ich hatte ein Straight Power 11 CM, also mit modularen Kabeln. Das machte auch erstmal Probleme mit meiner RX 6800XT, denn es kam darauf an, welche PCIe Buchsen zum Einsatz kamen, da es ein Multirail Design war , musste die Last möglichst gleichmäßig verteilt werden, ansonsten gab es Instabilität und Back to Desktop etc. Wer Netzteile nicht so gut kennt, nicht weiss was Single- und Multirail überhaupt bedeutet und am besten auch einfach drauf los steckt, ohne die Anleitung zu lesen, der bekommt u.U. Solche Probleme.
Natürlich kann es auch andere Ursachen haben, aber diese hier halte ich für sehr wahrscheinlich, hatte ich in der Werkstatt auf der Arbeit schon öfter mal, aufgrund des Alters wurde es dann meist eh getauscht. Solltest du die Option haben, dein System mal mit einem Single Rail Netzteil zu testen... Versuch macht klug. 😁
 
Wenn ich jetzt noch davon ausgehe das die PSU nach knapp 6 1/2 Jahren und einer Betriebszeit von ca. 13000-15000 Stunden durchaus Spuren von Degeneration aufweisen kann.

Ob das jetzt wirklich ausreicht, um die VRM vom MB dazu zu bringen selbst eine Schutzmachnik auszulösen oder der CPU eine außerhalb der Spec. befindliche Spannungsversorgung zu melden, oder dadurch VCore selbst soweit einbricht, um eine Schutzebene in der CPU zu triggern kann ich natürlich nicht mit Bestimmtheit sagen.
Ersteres ist völlig plausibel. Natürlich ist dein Netzteil über die vielen Stunden verschlissen und ja, dadurch sinkt die Spannungsqualität, aber nicht so wie du es dir vorstellst. Das NT produziert nicht auf einmal random Spannungsspitzen oder sowas, schon gar nicht im Niedriglastbereich.
Was bei verschliessenen Netzteilen passiert ist, dass die Regelung schlechter wird, bedeutet das Netzteil reagiert langsamer und ungenauer auf Lastwechsel und hat zunehmend Schwierigkeiten die +12V genau zu "treffen". Der Effekt wird aber umso stärker je höher die geforderte leistung ist, beideutet man bemerkt es wenn dann erst unter Vollast und nicht beim nichtstun (deswegen steigen alte zu verschlissene Netzteile bei hohen Lasten aus - die 12V werden nicht mehr erreicht und die UVP Funktion schaltet das Gerät ab).

Diese Schwanungen in der Spannung sind aber selbst wenn sie auftreten zu einem hohen Grad vom Mainboard toleriert. Bedenke: Du hast ein sehr hochwertiges Netzteil. Das liefert insbesondere bei wenig Last noch deutlich konstantere/sauberere Spannungen als ein Billig-NT, selbst wenn deins 15000h auf der Uhr hat. Die Spannungsversorgung deiner CPU ist extrem gut/schnell geregelt (das muss heute zwingend so sein sonst würde keine moderne CPU mehr laufen). Die kann im Millisekundenbereich anpassen und kleinere Verschlucker eines Netzteiles problemlos abpuffern und ausgleichen - sowas hat nur im Grenzbereich von OC einen Effekt, wo es nunmal nicht mehr egal ist ob bei der CPU 1,350v oder kurz 1,346v ankommen.

Wie oben schon gesagt - ich weiß wirklich nicht was dein problem genau verursacht (da du so viuel getestet hast wirds auch wirklich schwer...) und ich will auch nicht ausschließen dass das Netzteil am Ende doch der Schuldige sein könnte, nur ists generell eben sehr unwahrscheinlich dass sowas vom NT ausgelöst wird. Wenn du aber alles andere bestmöglich ausgeschlossen hast - naja, bleibt dir kaum eine Wahl wie das NT testweise zu ersetzen.
 
Ersteres ist völlig plausibel. Natürlich ist dein Netzteil über die vielen Stunden verschlissen und ja, dadurch sinkt die Spannungsqualität, aber nicht so wie du es dir vorstellst. Das NT produziert nicht auf einmal random Spannungsspitzen oder sowas, schon gar nicht im Niedriglastbereich.
Das ist mir schon bewusst. Deshalb habe ich mich dann auf den 550MHz-Lock konzentriert. Der ist reproduzierbar und damit auch diagnosefähig.
Was bei verschliessenen Netzteilen passiert ist, dass die Regelung schlechter wird, bedeutet das Netzteil reagiert langsamer und ungenauer auf Lastwechsel und hat zunehmend Schwierigkeiten die +12V genau zu "treffen". Der Effekt wird aber umso stärker je höher die geforderte leistung ist, beideutet man bemerkt es wenn dann erst unter Vollast und nicht beim nichtstun (deswegen steigen alte zu verschlissene Netzteile bei hohen Lasten aus - die 12V werden nicht mehr erreicht und die UVP Funktion schaltet das Gerät ab).
Richtig, Die Regelung wird träger und ungenauer. Darauf basiert ja meine Theorie. Ich bin nie davon ausgegangen, dass die PSU nicht mehr genug Dauerleistung hat. Das hätte genau das ausgelöst was du beschrieben hast. UVP bei Volllast. Nach meiner Brechung sollte das System +- 650Watt unter Volllast brauchen, also sollte genug Puffer vorhanden sein.

Nach meiner Theorie passiert folgendes:
GPU ist voll ausgelastet und die CPU nahe Volllast. So weit ist alles OK und läuft sauber. Dann gerät das System ins CPU-Bottleneck. Die GPU boosted nicht mehr bzw. weniger da sie nicht mehr ausgelastet ist. Die CPU ist aber nicht konstant überlastet. Dadurch wechselt die GPU schnell immer zwischen Teil- und Volllast. Erkennbar an der extrem unruhigen Framerate. Die dadurch auftretenden Transienten sorgen dafür das 12V einbricht bzw. destabilisiert wird, aber nicht genug bzw. nicht lang genug, um UVP zu triggern. Das veranlasst dann den VRM eine ungültige Spannung zu melden und die die CPU geht in den Failsave.

Diese Theorie wird von der Tatsache, dass ein 60FPS-Lock hilft unterstützt. Weil mit dem Lock erzeuge ich eine gleichmäßige Last und Transienten werden vermieden bzw. stark abgeschwächt.

Warum ist das mit der alten GPU nicht aufgetreten?
Weil das eine RTX 2080 war. Sprich kein so aggressiver Boost und auch keine extremen Transienten.

Und ja, dass Straight Power 11 Gold ist ohne Zweifel sehr hochwertig und kann weitaus mehr ab als günstigere PSUs.
Aber es kam auch schon 2018 raus und ist ATX 2.4. Da waren Transienten, wie wir sie heute erleben noch kein Thema. Also nehme ich an, dass es diese zwar verkraftet, aber wahrscheinlich nicht so gut wie ein eine ATX 3.0/3.1 PSU.
Wie oben schon gesagt - ich weiß wirklich nicht was dein problem genau verursacht (da du so viuel getestet hast wirds auch wirklich schwer...) und ich will auch nicht ausschließen dass das Netzteil am Ende doch der Schuldige sein könnte, nur ists generell eben sehr unwahrscheinlich dass sowas vom NT ausgelöst wird. Wenn du aber alles andere bestmöglich ausgeschlossen hast - naja, bleibt dir kaum eine Wahl wie das NT testweise zu ersetzen.
Das ist ja auch mein Problem. Da ich schon viel getestet habe, und mir die Ideen ausgehen, setzte ich auf das Schwarmwissen unserer Community.
In der Hoffnung das noch jemand eine Idee hat, die ich noch nicht hatte oder eventuell sogar was ähnliches schon mal gehört oder erlebt hat.
 
Zurück