RTX2080 schaltet sich unter Last ab

schlenzie

Freizeitschrauber(in)
Hallo zusammen, nachdem ich nun mehrere Jahre hier inaktiv war - habe ich leider ein Problem.
Ich habe die letzten Monate Star Trek Fleet Command gespielt und nicht viel Rechenleistung von meinem PC abverlangt.
Wenn ich jetzt ein Spiel starte (und ich habe inzwischen mein gesamtes System ohne Backup neu aufgesetzt) geht der Monitor aus und alle Lüfter fahren auf 100%. Mit der Onboard Grafik passiert das nicht. Kann ich davon ausgehen, das die RTX nun ihr EoL erreicht hat?

CPU Stresstest geht nicht über 60 Grad, bleibt stabil und alles ist i.O.
Furmark mit allen Kästchen an: Kurze Zeit nach dem Start - black screen und volle Lüfter / Temp. GraKa ca. 60°

Ich würde einen Fehler im CPU Kühler sowie der CPU selbst erstmal ausschließen wollen und habe weiterhin die GraKa im Verdacht. Aber gibt es nicht die Regel in der IT, geht oder geht nicht? Ein geht vielleicht oder verzögert ist schon komisch
 
Zuletzt bearbeitet:
Schnapp dir mal den MSI Afterburner und reduziere den Takt deiner GPU testweise um 200 oder 300 MHz:
1719407641643.png


Dann probierste den Furmark erneut. Wenn die Karte dann stabil läuft ist die Karte schuld (bzw. instabil unter Last), wenns dann immer noch abschmiert ist ggf. dein Netzteil Schuld (altersbedingter Verschleiß), wobei das bei einem Seasonic TX850 auch sehr unwahrscheinlich ist. Das Ding kann auch gefühlt nach 15 Jahren noch ne 2080er bedienen.

Du kannst deine CPU/RAM auch noch auf Stabilität prüfen abseits der Grafikkarte, etwa mit 20 Minuten Prime95 "Blend".

Aber gibt es nicht die Regel in der IT, geht oder geht nicht?
Ja - Blackscreen unter Last zählt zu "geht nicht"... ;-)
 
Wenn du Glück hast ist es nur ein Fehler des Grafikkartentreibers, ich würde den aktuellen löschen - via DDU im Abgesicherten Modus.
Teste danach andere Versionen, die können auch ruhig älter sein, teste einige durch.

Wenn dies nicht hilft, versuche via MSI Afterburner die Werte zu senken, Chiptakt, Vram-Takt und PowerLimit.
Hardware altert auch, Stichwort Elektromigration, vor allem wenn sie viel mit voller Leistung fahren muss - als wenn man keinen FPS-Limit einsetzt.
 
Hast du auch mal nen HWInfo Screenshot? Ggf. sogar unter Last?
Graka-Durschnittstemp sagt halt nicht viel aus, wenn die WLP schlecht aufgetragen ist kann die Hotspot Temp auch gerne mal 40°C höher liegen.
 
Das sind die falschen screens gewesen… ich habe ein Video bis zum Absturz gemacht und die letzte Sekunde gespeichert. Die Werte sind für mich ok. Beim Absturz rennen die GraKa auf 100% und nicht die Gehäuselüfter, das habe ich vorher falsch gesehen.
Später werde ich das Thema mit dem MSI Tool noch ausprobieren. Ggf. Kann ich meine Karte auch zu einem Nachbarn bringen und dort ausprobieren

Das Foto von Furemark ist nachdem ich den Takt im MSI Tool sogar um das maximal gekürzt habe. Der Effekt blieb identisch, ob 200, 300 oder 500mhz. Klingt doof, aber soll es jetzt noch an der GraKa liegen?
 

Anhänge

  • IMG_4977.png
    IMG_4977.png
    3,8 MB · Aufrufe: 26
  • IMG_4975.png
    IMG_4975.png
    3 MB · Aufrufe: 24
  • IMG_4983.jpeg
    IMG_4983.jpeg
    2,4 MB · Aufrufe: 26
Zuletzt bearbeitet:
Es gibt nur zwei gründe weswegen ne gpu abstürzt
Überhitzung des chips und zu geringe Stromversorgung sprich Netzteil
meist Pc aus und reset.
Im Gegensatz zu früher vor 2010 haben heutige gpu Sicherheitsschaltungen die die gpu abschalten bevor diese gegrillt wird.
Folglich Würde ich prüfen ob die gpu core temp hotspot temp Differenz noch ok sind und wie hoch die temps gehen.
Das ist bei der turing gen um die 13-16°c je nach Kühler. Üblich sind zwischen 80-85° vs 95-100°c.
Falls die sku keine hotspot sensor hat (eher unwahrscheinlich da mit gtx9xx eingeführt) wird es schwierig
Netzteil defekt bzw Altersschwäche ist wahrscheinlicher neben einen verdreckten Kühler der gpu bzw Lüfter defekt.
Gpu sind mittlerweile so gut eingestellt das diese quasi nie degradieren. Da quasi Perfekt am limit laufen.
Das ist seit der gtx4xx Serie so (2010) daher ist verschmutzte Kühlung und ein defektes Netzteil sehr wahrscheinlich.

Ich sage ja seit 10 Jahren das gpu oc komplett Sinnfrei ist und bei cpu seit amd zen Serie

Ein defekt der gpu bemerkt man in der Regel sofort system freezes und Bildfehler
Das trifft hier nicht zu da einfach pc aus.
Mir ist schon öfter Netzteile defekt gegangen aber nie ne gpu seit dem letzten corsair kaufe ich nur noch cybernetics geprüfte Netzteile.
Aktuell hab ich nenn bq pp 11 550w dein seasonic prime tx850 hat kein cybernetics also keine geprüfte Schutzschaltungen
Zwar gibt es nenn Test dazu aber auch nur Sichtung (Specsheets and aufn Platine geguckt) nicht geprüft
Netzteiltest sich schwierig und ohne prüfstation kaum als einfache Redaktion umsetzbar. Eher ne Nutzererfahrung daher würde ich das Netzteil nicht ausschließen bei dem Fehlerbild.

Auch für Spielabstürze weniger pc aus, kommt noch der ram ins spiel. neben einer Cpu Instabilität.
Seit dem Skandal über fehlende specs bei intel cpu würde ich alle mainboard Einstellungen prüfen ob intel vorgaben auch aktiv sind.
Das hat alles mit dem so1151v2 angefangen 2017
Das wäre meine dritte option wenn bei den anderen nicht zutreffen.
 
Vielen Dank für das ausführliche! Leider entstehen dadurch noch mehr Fragen als Antworten vorliegen :-P
Was ich vorweg nehmen kann, das Netzteil ist ca. 24 Monate alt, hier sollte von Altersschwäche in der Top Liga keine Rede sein. Immerhin haben die auch als OEM die alten Corsair AX Serien gebaut, die lief sehr sehr lange in meinem Gehäuse bis ich es mit anderen Teilen verkaufte.
Keiner meiner Kühler ist verdreckt, da ich sie auch wunderbar sehen kann. Die GPU hatte ich gestern sogar noch ausgebaut und genau das geprüft und erneut ausgeblasen. Also schließe ich eine dicke Staubschicht ebenfalls aus.
Ob genügend Strom bei der Karte ankommt? Genau hier wird es interessant, da ich keinen Schimmer hab, wie ich das prüfen könnte.
 
Was sagt die Ereignisanzeige unter Windows Protokolle -> System zum Absturzzeitpunkt?
Bitte mal die letzten paar allgemeinen Meldungen da screenshotten.
 
Was sagt die Ereignisanzeige unter Windows Protokolle -> System zum Absturzzeitpunkt?
Bitte mal die letzten paar allgemeinen Meldungen da screenshotten.
Mega interessant, weil mal kein Ereignis erstellt wird. Außer dass das System ohne vorheriges Runterfahren Neu gestartet wurde.

Andere Frage, kann es vielleicht an diesem Intel ME (Management Engine) liegen? Das einzige was ich geändert hatte in letzter Zeit war ein Bios Update. Asus gibt zu der 2203 Version folgenden Hinweis:

“Before BIOS update, please download Intel ME update tool from ASUS support site, and update ME firmware to Version 15.0.45.2411V2 to ensure optimized system settings

Leider kann ich die aktuelle Version nicht installieren, da ich immer wieder diese Meldung erhalten: (aber auch jede andere Funktioniert nicht). Ich habe keine Ahnung wie man dieses Treiber installiert, muss ich gestehen. Anklicken der .exe reicht hier wohl nicht aus.

Screenshot 2024-06-28 125104.png
 
Naja, bei nem 11700K kannst du davon ausgehen, dass kein Link auf der Asus Seite aktuell ist.
Da solltest du dir die Treiber von der Intel Seite besorgen.

Wenn keine Meldung abgelegt wird ist es meist das Netzteil oder die Verkabelung.
 
Den ME Treiber konnte ich dank Google Suche nun über CMD installieren und wurde direkt im Bios übernommen - ohne Erfolg :daumen2:

Andere Kabel aus der Schachtel des Netzteils verbaut und getestet, wie auch andere Steckerplätze - ohne Erfolg :daumen2:

Auf 2. PCI Slot gewechselt, ohne Erfolg :daumen2:

Da ich nun völlig Ratlos bin, bekomme ich von Amazon morgen ein BeQuiet Dark Power 13 850W Netzteil "zum testen" / wir hoffen aufs beste.... Bei Erfolg kann ich bei Seasonic ein RMA Fall öffnen. Ich hoffe wirklich, das es daran liegt. Denn ich habe noch ca. 10 Jahre Restgarantie auf das Schmuckstück - besser als eine neue GraKa!

Als dank der ganzen Aktion habe ich wohl irgendwo 2 Kabel rauszogen und Teile der Beleuchtung im Kabel-Nirvana verloren. Es wird immer besser :heul:

IMG_5007.JPG
 
Zuletzt bearbeitet:
Bevor du dich quälst, so wie ich... rate ich dir. Bau die Graka aus und teste diese in nem Rechner von nem Kumpel oder so. Falls da das Verhalten gleich ist, dann ist wohl was defekt, was so schnell und günstig nicht reparierbar ist :( meine 1080 ti macht leider genau das gleiche.
 
habe leider deine Nachricht zu spät gelesen und das andere NT provisorisch angebaut und was soll ich sagen…. Es liegt wohl nicht am Netzteil 👀

Direkt wieder abgeschmiert und Lüfter der GraKa auf 100%.

Nächster Step, Karte woanders testen… hoffe das Netzteil von meinem Kumpel packt die Karte überhaupt.

2. Halbzeit - kompletter Rückbau 😂
 

Anhänge

  • IMG_5014.jpeg
    IMG_5014.jpeg
    1,5 MB · Aufrufe: 17
  • IMG_5013.jpeg
    IMG_5013.jpeg
    1,5 MB · Aufrufe: 17
Guck bitte nochmal die Ereignisanzeige durch und mach nochmal nen HWInfo Screenshot von allen Sensoren...

Du kannst die Spalten auch mit den Pfeilen links unten teilen.
 
Sry, die Karte war kurz vor deinem Post bereits ausgebaut, nachdem ich stundenlang die ARGB Kabel wieder neu zusammengesteckt hatte. Ich muss wohl irgendwo 2 Kabel abgemacht haben bei dem ganzen Mist.
 
Eben eine RTX4070 Super eingebaut und siehe da, jeder GPU Stresstest läuft einwandfrei... Jetzt nur nochmal meine Karte in einem anderen System testen - aber ich denke das Ergebnis ist wenig versprechend.
 
Zurück