Navi 5700 Blackscreen, Crash, Framedrops. Workaround.

Gurdi

Kokü-Junkie (m/w)
Vielleicht mal hier ein kleiner Workaround an alle die Probleme mit den Karten haben. Derzeit scheint es so das einige Probleme haben mit den Karten/Treiber, andere wiederum nicht.
Ich selbst bin mit meiner Karte NICHT betroffen, hoffe jedoch das man das so mal ein wenig Lösungskompetenz gebündelt bekommt.
1.Ladet euch das MorePowerTool runter.
MorePowerTool – AMD Radeon RX 5700 (XT), RX 5600 (XT), RX 5500 (XT) und Radeon VII Tweaking- und UEbertaktungssoftware | Update 1.2.0 – Seite 2 – igor sLAB
2. Erstellt einen Screenshot wie hier, das Tool lässt sich mehrfach öffnen.
MPT Übersicht.png
3.Setzt die Karte mit einer fordernden 3D Anwendung unter Last und macht nen Screen von einem Monitoring, entweder aus GPUZ oder vom MSI Afterburner.
So zum Beispiel, wichtig sind die Haupttemps sowie die Taktraten von GPU und Speicher.
Screenshot (101).png
4.Eine GENAUE Beschreibung des Problems. habt Ihr eine Back to Desktop, habt Ihr nen Blackscreen, freezt die ganze Kiste und rebootet.

Anhand der Informationen kann euch geholfen werden.


Problemlösung, idealerweise in der Reihenfolge durchführen, anderweitiges Overclocking evtl. auf dem Ram auf jeden Fall auf Stock setzen vorher:
1. Treiber komplett neu aufsetzen mit dem AMD CleanUtility.
https://www.amd.com/de/support/kb/faq/gpu-601
2. Älteren Treiber versuchen:
Am besten den hier: https://drivers.amd.com/drivers/beta/win10-radeon-software-adrenalin-2019-edition-19.12.1-dec2.exe
3.Verwendet Ihr eine manuelle Lüfterkurve? Dies ausstellen und Alternativ via MPT einstellen.
4.HDCP Unterstützung deaktiveren, unter Gaming/GlobalAnzeige/Überschreiben
5.Hardwarebeschleunigung in evtl.Hintergrundprogrammen wie Browsern deaktiveren.
6.Unnötige Software im Hintergrund beenden, vorallem Sachen wie Afterbruner, Razer Synapse,Corsair ICU etc.
7. Anpassen folgender Werte im MPT:
Maximum Voltage SOC: 1075mv
Minimum Voltage SOC:825mv
Minimum Voltage GFX:800mv

8.Alternativ;
Maximum Voltage SOC: 1125mv
Minimum Voltage SOC:825mv
Minimum Voltage GFX:800mv

9.Test mit maximaler Lüfterleistung durchführen, also Lüfter auf 100% und testen.
10.Speichertakt reduzieren auf 1500-1600
11.Coreclock reduzieren um mindestens 10%


Hilft alles das NICHT ist die Karte womöglich defekt. Probleme können teilweise auch die Stützzeiten von Netzteilen machen. Lösungsansatz hier ist beispielsweise das aufteilen der PCIEX.Lanes. In der Regel haben die meisten NT 2x2 12V Stränge. Verwendet von jedem der beiden, jeweils ein Kabel.
Löst Punkt 7-11 euer Problem, schafft die Karte Ihre Stockwerte nicht und wäre damit ebenfalls ein Garantiefall ODER aber eure Kühlung ist unzureichend.

Wenn etwas davon euer Problem löst, postet doch bitte hier kurz welches Problem genau Ihr mit welchem Ansatz gelöst habt.
 
Zuletzt bearbeitet:
Ich nutze den Thread hier mal um meine Erfahrung und Lösung mit Blackscreens und anschließendem Reboot bei meiner Powercolour RX5700 XT Red Devil zu teilen. Vielleicht hilft es ja jemandem.

Kurz vorweg, sobald ich XMP (bei Asus D.O.C.P) aktiviere bekomme ich von meinem Mainboard Asus TUF Gaming X570-Plus Wifi die Meldung im BIOS das XMP bei PCI 4.0 Geräten aktuell zu einem instabilen System führt. Bios Version ist die aktuelle 1405.
Es ist auch tatsächlich so, die Abstürze sind sehr häufig mit XMP. Daher bleibt es bei mir voerst deaktiviert.

Ich habe immer wieder Blackscreens mit Reboot gehabt ohne das eine Fehlermeldung in der Ereignisanzeige von Windows angelegt wird.
Ich habe darauf hin nach und nach alle Sync Funktionen im Radeon Treiber ausgeschaltet (FreeSync, Enhanced Sync, ...) Wobei Radeon Chill bei mir am instabilsten ist, sobald ich das aktiviere schmiert der PC nach 5 min ab.
Durch das deaktivieren sind die Blackscreens selten geworden, traten nach längerer belastung der GPU aber immer noch auf.

Mir fiel auf das die GPU nach längerer Last anfängt runter zu takten (durchschnittliche FPS wurden immer weniger). Immer wenn das Drosseln begann, hatte ich nach kurzer Zeit einen Blackscreen.
Die Auto Einstellung der Lüfter im Radeon Treiber lässt bei mir eine max. rpm von 50% zu (WTF????) Sobald das nicht mehr reicht um die GPU zu kühlen, hat diese den Takt reduziert.
Ich habe eine manuelle Lüfterkurve erstellt die bei höheren Temps eine höhere rpm zu lässt, was auf dem Diagramm absolut zum Kotzen ist da das Diagramm Logarythmisch skaliert ist.
Außerdem kann man so keine passive Kühlung der GPU mehr einstellen, so wie es im Auto-Modus ist.

Seitdem habe ich allerdings keine Blackscreens mehr und mein System ist stabil.
Ich hoffe es hilft jemand anderem weiter.

Edit: Der Radeon Treiber reduziert bei mir die max. rpm meiner manuellen Lüfterkurve auf 50% rpm bei 100% Leistung nach einem System Neustart. Er überschreibt mein Profil automatisch.
 
Zuletzt bearbeitet:
Ich möchte nochmal was zu diesem Thema beitragen.

Ich habe selber eine Navi in Form einer nitro+.
Ich bin einer der glücklichen der scheinbar ein sehr guten Chip erwischt hat. Aufgrund dieser Situation habe ich daher viel an meiner GraKa herumgespielt.
Dadurch konnte ich in etwa sehen wie Sie "tickt". Also wie sie sich verhält bei bestimmten Settings und Situationen.

Dabei hatte ich natürlich auch Kontakt mit dieser sog. Blackscreen Thematik.
Ich bilde mir ein, dort gewisse Zusammenhänge erkannt zu haben...

Meiner Ansicht nach ist weniger AMDs Treiber schuld, als viel mehr die Custom Hersteller und ihren "eignen" BIOS Versionen.

Ich denke, die Blackscreens haben nur einen Ursprung. Nämlich Instabilität in Form von zu niedriger Spannung.

Navi ist wie ihr alle wisst, sehr eifrig darin schnell den Takt und die Spannung anzupassen. Dafür nutzt Sie bestimmte physikalische Größen, wie Temperatur und Last in Form von Stromaufnahme. Diese werden Sensortechnisch erfasst.
AMD's Herangehensweise dieses Anpassen des Taktes und der Spannung, bietet natürlich ein gewisses Risiko.

Aufgrund der verschiedenen States, in dem sich der Chip begeben kann, gelten gewisse Thresholds. je nachdem in welchem State er sich befindet, ist sein Takt und die Spannung anders.
Die Thresholds werden im Bios und im AMD's eignen Wattmann geändert bzw. definiert.

Ist nun einer dieser Parameter "falsch" kann dies zu einer instabilen Zustand führen. Der chip resetet sich oder geht in einen Schutz zustand.
Wenn er sich restet, stürzt die Applikation ab und der Treiber startet erneut. Im Schutz zustand gibt die Graka kein Bild mehr aus. Der sog. Black Screen tritt auf.

Aufgrund der Streuung der Chipgüte verhält sich jeder Chip anders. Normalerweise geht der Hersteller deswegen auf Nummer sicher und wählt Settings wo er zu 99,99% läuft.
Was jedoch, wenn Hersteller wie ASUS, Sapphire oder sonst wer im BIOS eben genau diese Settings zu Hemdsärmlig wählen?

Ich kann mit meiner Navi Blackscreens und Treiber resets provozieren, wenn ich die Spannung zu niedrig wähle.

Man könnte also versuchen, wenn eine NAVI ab Kauf mit Default Settings nicht stabil läuft, mit einer Erhöhung der Spannungen in den einzelnen States unter die Arme zu greifen.

Bitte um rege Diskussion. Vielleicht liege ich ja falsch.
Jedoch bedenkt.... Software Bugs sind idR. immer reproduzierbar.
Hardware verhält sich anders. Hier treten Fehler stochastisch auf. Und soweit ich weiß hat nicht jeder diese Probleme....
 
Ich kann mit meiner Navi Blackscreens und Treiber resets provozieren, wenn ich die Spannung zu niedrig wähle.
Das ist aber bei jeder Grafikkarte die exisitiert so ;) Wählst du die Spannung zu niedrig, Blackscreen. Das ist ja völlig normal.
Man könnte also versuchen, wenn eine NAVI ab Kauf mit Default Settings nicht stabil läuft, mit einer Erhöhung der Spannungen in den einzelnen States unter die Arme zu greifen.
Wenn das so einfach wäre hätte niemand Probleme. Ich predige seit Tag 1, erhöht die Spannung im mittleren und im minimal Bereich! Das hilft auch bei einigen, aber eben nicht bei allen. Und ein Erhöhen der Maximal Spannung macht gar keinen Sinn.
 
Du meinst jeder kann und will sich damit beschäftigt haben? Du irrst. Du darfst nicht von dir ausgehen. Es gibt genug die einfach nur spielen wollen und den Treiber noch nie geöffnet haben.

Und das jede Elektronik so reagiert ist mir durchaus klar. Nur gab es früher jede Menge Karten da konntest du keine Spannungen anpassen. Pascal War zum Beispiel sehr restriktiv was das anging. Es war aber auch selten notwendig. Weil es funktionierte...
 
Du meinst jeder kann und will sich damit beschäftigt haben? Du irrst. Du darfst nicht von dir ausgehen. Es gibt genug die einfach nur spielen wollen und den Treiber noch nie geöffnet haben.
Das stimmt natürlich und das bezweifel ich auch nicht.
Trotzdem ist das eben nicht die Lösung des Problems, weil es offenbar Leute gibt, die auch mit angehobener Spannung noch Blackscreens bekommen.
Ich denke es liegt zur Zeit an einer Kombination aus mehreren Dingen:
-zu niedrige Spannung im niedrig frequenten Bereich
-ständige Windows Updates
-alte Monitore/Multi Monitor Setups
-diverse Adapter

Kombiniert man diese ganzen Sachen erhält man einen Kunden der Blackscreens bekommt und das nicht so einfach lösen kann, weil er einfach nicht merkt woran es liegt. Es muss ja nur 1 Punkt zutreffen und schon kanns passieren. Treffen vielleicht sogar mehrere Punkte parallel zu und in der Zwischenzeit erscheinen neue Updates wirds schwer den Fehler immer neu zu finden.

Ich hatte z.B. vor 2 Tagen ein Windows Update und am nächsten Tag hatte ich random einen Blackscreen. Es ist ziemlich unwahrscheinlich, dass der Treiber daran schuld ist, weil ich noch auf 19.11.3 bin seit über 2 Monaten. Und ich seit über 2 Monaten kein einziges Problem mit dem hatte. Und dann auf einmal plötzlich nach nem Windows Update...
 
Ja so sehe ich es auch wie xlord! Ihr dürft wirklich nicht vergessen das 99% der Benutzer solche Karten nur nutzen wollen und nicht aktiv in Foren wie wir unterwegs sind. Was für uns selbstverständlich ist, ist es bei den anderen eben nicht und wollen nur einstecken und spielen.

Ich habe zb auch keine Ahnung von Autos und will nur das es fährt und wenn ein Problem ist fahre ich damit in die Werkstatt. Andere tauschen sich da in Foren aus und lösen es so. Daher sollte es einfach hier im Forum nicht zur Selbstverständlichkeit werden weil wir unsere Probleme austauschen und dann uns zu helfen wissen.

Klar gibt es auch Clowns im Forum die natürlich da auf den Zug aufspringen und die Chance nutzen alles in den Dreck zu ziehen, aber ist das nicht überall auf der Welt so egal ob Fussball, Politik, Marken usw?
 
Das stimmt natürlich und das bezweifel ich auch nicht.
Trotzdem ist das eben nicht die Lösung des Problems, weil es offenbar Leute gibt, die auch mit angehobener Spannung noch Blackscreens bekommen.
Ich denke es liegt zur Zeit an einer Kombination aus mehreren Dingen:
-zu niedrige Spannung im niedrig frequenten Bereich
-ständige Windows Updates
-alte Monitore/Multi Monitor Setups
-diverse Adapter

Kombiniert man diese ganzen Sachen erhält man einen Kunden der Blackscreens bekommt und das nicht so einfach lösen kann, weil er einfach nicht merkt woran es liegt. Es muss ja nur 1 Punkt zutreffen und schon kanns passieren. Treffen vielleicht sogar mehrere Punkte parallel zu und in der Zwischenzeit erscheinen neue Updates wirds schwer den Fehler immer neu zu finden.

Ich hatte z.B. vor 2 Tagen ein Windows Update und am nächsten Tag hatte ich random einen Blackscreen. Es ist ziemlich unwahrscheinlich, dass der Treiber daran schuld ist, weil ich noch auf 19.11.3 bin seit über 2 Monaten. Und ich seit über 2 Monaten kein einziges Problem mit dem hatte. Und dann auf einmal plötzlich nach nem Windows Update...

Und auch da könntest du einen Denkfehler haben. Herstellen gelingt es mit jedem Treiber ihre Hardware besser in den Griff zu bekommen. Bei Video Cards macht sich das durch immer bessere Auslastung der Einheiten bemerkbar. Was vorher durch UV stabil war muss im nächsten Treiber nicht mehr gelten....
 
Und auch da könntest du einen Denkfehler haben. Herstellen gelingt es mit jedem Treiber ihre Hardware besser in den Griff zu bekommen. Bei Video Cards macht sich das durch immer bessere Auslastung der Einheiten bemerkbar. Was vorher durch UV stabil war muss im nächsten Treiber nicht mehr gelten....
Ich hab meinen Treiber nicht verändert. Es ist nach wie vor der selbe, kein Update. Ich hab ein Windows Update gemacht, kein Treiber Update.
 
Tja auf mehr kann ich mich halb auch nicht berufen derzeit, macht die Lösung nicht besser. Irgendwie sammeln sich hier aber keine Leute mit Problemen in der Richtung, von daher kann ich das nicht nachvollziehen. Wenn wirklich so viele Probleme hätten, müsste dieser Thread hier mehr Klicks haben und vor allem auch mal hin und wieder konsultiert werden. Dafür hab ich den ja aufgemacht.
 
Ich glaube eher, dass die Leute gar nicht wirklich was unternehmen wollen gegen die Probleme. Ich hab den Thread schon mehrfach verlinkt, aber es wird gar nicht drauf eingegangen.
Denke das liegt daran, dass die Leute einfach wollen, dass die Karte läuft ohne da groß selbst dran rum zu schrauben. "Ladet euch das MPT Tool runter" ist da wahrscheinlich für ein Großteil der Käufer zu viel verlangt. So ist das halt leider.

Es ist wie in der Kaufberatung. Jeden Tag flattern etliche Threads rein mit "lohnt sich ein aufrüsten?" oder "welches Teil soll ich aufrüsten?". In den Stickys steht exakt beschrieben wie man das herausfindet welches Teil man aufrüsten soll und die Leute lesen es sogar, weil sie den Fragebogen für die Kaufberatung ja offensichtlich gefunden haben, aber durchführen tut es trotzdem niemand und als Antwort kommt immer nur "keine Ahnung was mich limitiert". Dafür sind die meisten ja hier, um eine Zusammenstellung oder eine Problemlösung ohne großen Selbstaufwand direkt zu lesen bekommen.
 
Doch das checke ich. Hab ich was anderes behauptet?

Es ist wie in der Kaufberatung. Jeden Tag flattern etliche Threads rein mit "lohnt sich ein aufrüsten?" oder "welches Teil soll ich aufrüsten?". In den Stickys steht exakt beschrieben wie man das herausfindet welches Teil man aufrüsten soll und die Leute lesen es sogar, weil sie den Fragebogen für die Kaufberatung ja offensichtlich gefunden haben, aber durchführen tut es trotzdem niemand
Das hier hatte nichts mit den AMD Karten zu tun. Denn ja, das sollte man wohl tun.
 
Zurück