Rtx 4090 Probleme

stuxcom

PC-Selbstbauer(in)
Zum Problem.
Wenn meine Palit Rtx 4090 im Stock läuft kommt es immer wieder zu folgenden Problemen.

Blackscreen inkl. 100% Fanspeed.
Oder
Einfach nur Blackscreen, teilweise läuft Youtube z.B. weiter.

Das Problem tritt unter Last sowie im Desktop Betrieb auf.
Die Lösung die aktuell hilft ist die Karte zu undervolten, aber das kann es ja nicht sein!
Ich hatte vor Monaten das Netzteil zu einem Asus Rog Loki SFX-L 1000W Platinum Netzteil getauscht, seitdem tritt das Problem
auch auf!

Welche Lösungsansätze habe ich bisher versucht:
Bios Update: Keine Verbesserung
Default Setup im Bios: Keine Verbesserung
Temperaturen beobachtet: Keine Auffälligkeiten

Habe mir Stecker sowie Kabel am Netzteil, sowie GPU angeschaut und nichts auffälliges bemerkt.
Ich tippe ja auf den ach so tollen 12VHPWR Stecker!
Wie würdet ihr vorgehen?

Danke!
 
An sich seitdem umstieg auf das neue Netzteil.
Wichtig wäre vllt noch zu erwähnen das die Rtx 4090 an einem Riser Kabel angeschlossen ist.
 
Das heißt leider gar nichts. Nvidia hat seit der RTX4er Serie echt nachgelassen was die Treiber betrifft.

Du schreibst, dass es erst mit dem neuen Netzteil angefangen hat?

Ja in der Zeit müsste es gewesen sein. Mit undervolting gibt es keine Probleme.
Habe jetzt mal in die Ereignisanzeige geguckt und bin erstmal geschockt!

So viel zu "keinen" Problemen.
4090.jpg
 
Hey, ich hatte das damals bei meiner 3090 ähnliches.
Bei mir war es das Kabel.
Ich würde also dies nochmal Ausstecken an der GPU und an der PSU (Netzteil) und dann Sauber und mit etwas Kraft einstecken, so das es wirklich komplett drin ist.
Dann am besten das Kabel nicht mehr bewegen (also Kablemangement vor dem Einstecken machen).

Hast du uns ein Bild vom PC inneren ?
 
Bis jetzt läuft es mit PCIe 3.0 stabil. Möchte der Sache noch mehr Zeit geben um wirklich sicher zu sein.
Was würde das aussagen?
Ob ich heute auf Grund eines Hexenschusses basteln kann bleibt abzuwarten.

Das Riser Kabel kann ich erst mit Ankunft des Benchtables testen.
 
Was würde das aussagen?
Dass das Riser Kabel entweder defekt ist und deswegen nur PCIe 3.0 packt oder schlicht nur für PCIe 3.0 spezifiziert ist.

Dass die Grafikkarte was hat halte ich für extrem unwahrscheinlich. Wenn die Probleme mit dem PCIe Anschluss hat resultiert das normalerweise darin dass sie nur mit 8 oder weniger Lanes hat.

Ganz sicher weißt du das aber erst wenn du ohne Riser Kabel getestet hast.
 
Also folgendes kann ich berichten:

Mit PCIe 3.0 lief es Problemlos aber mit Meldungen in der Ergebnisanzeige!
Riserkabel entfernt und zack sind die Fehlermeldungen rund um PCIe der Ergebnisanzeige weg!

Möchte mich noch nicht zu früh freuen aber es sieht gut aus!
Ich möchte mich für die Hilfe aller hier bedanken!

DANKE!
 
Ein Riserkabel soll nicht länger als 20 cm sein. Auch wenn Pcie 4.0 geeignet draufsteht bedeutet es nicht, das es funktioniert. Je länger desto fehleranfälliger, weil zb. Drahtquerschnitt nicht passt, störanfällig wegen anderen elektrischen Teilen, Leitungsdämpfung. Die Leiterbahnen am Board werden ja auch so kurz wie möglich gehalten, da sonst die Signalqualität leidet.
 
RTX 4090 – DX12 Device Removed / Spielabstürze nach längerer Laufzeit, später auch Desktop-Crashes (Hotspot unauffällig)
System:
GPU: NVIDIA GeForce RTX 4090
Netzteil: ASUS ROG Thor 1000W
Stromkabel: originales 12VHPWR-Kabel (kein Adapter)
Treiber: NVIDIA (mehrere Versionen getestet, inkl. Studio Driver)
Betriebssystem: Windows 10/11 (aktuell)
Monitor-Setup: Hauptmonitor an GPU, Zweitmonitor an iGPU (Mainboard)
Problem-Beschreibung:
Ich habe seit einiger Zeit instabile Abstürze der RTX 4090, hauptsächlich unter DX12-Last, inzwischen aber auch im normalen Desktop-Betrieb.
Das typische Verhalten ist reproduzierbar:
Nach einem Kaltstart läuft das System zunächst 1–2 Stunden stabil
Besonders auffällig in Hunt: Showdown (DX12), teilweise auch in anderen Anwendungen
Erster Absturz:
Das Spiel schließt sich plötzlich
Fehlermeldung: D3D12 Device Removed
PC läuft weiter
Der Monitor, der am Mainboard (iGPU) hängt, bleibt durchgehend aktiv
Nach dem ersten Absturz:
Weitere Abstürze treten alle ~20 Minuten auf
Teilweise auch im Desktop-Betrieb (ohne Spiel)
Erst ein kompletter Neustart stellt wieder temporäre Stabilität her
Das wirkt wie eine Abwärtsspirale, sobald der erste GPU-Reset stattgefunden hat.
Temperaturen & Monitoring (HWiNFO):
GPU Core Temperatur: unauffällig (< 75 °C)
GPU Hotspot: steigt nie über ~75 °C
VRAM Junction: im grünen Bereich
Keine Anzeichen von Thermal Throttling
Keine extremen Power-Spikes sichtbar
GPU-Takt und Spannung brechen kurz vor dem Absturz abrupt ein
Thermik scheint nicht der Auslöser zu sein.
Bisherige Tests & Maßnahmen:
Saubere Treiber-Neuinstallation mit DDU (abgesicherter Modus)
Wechsel zwischen Game Ready und Studio Driver
Power Limit reduziert (bis auf 70 % getestet)
Starkes Undervolting (stabile Kurve, keine Boost-Spikes)
FPS-Limit gesetzt
DX11 getestet (deutlich stabiler als DX12)
XMP testweise deaktiviert
TDR-Delay in der Registry erhöht
Monitoring-Tools & Overlays deaktiviert
Ergebnis:
Die Maßnahmen verlängern teilweise die Laufzeit, verhindern die Abstürze aber nicht vollständig.
Besonders auffällig bleibt das zeitabhängige Verhalten (erst stabil, dann zunehmend instabil).
Event Viewer / Fehlermeldungen:
„Display driver nvlddmkm stopped responding“
Kernel-EventTracing
Application Hang
DX12 Device Removed
Einschätzung / offene Frage:
Da
die Temperaturen (inkl. Hotspot) unauffällig sind,
das Problem zeitabhängig auftritt,
sich nach dem ersten Absturz häuft,
und schließlich auch den Desktop betrifft,
vermute ich kein klassisches Temperatur- oder Netzteilproblem, sondern eine instabile GPU (Silizium / Spannungsdomäne / Speichercontroller), die unter längerer Laufzeit degradiert und sich erst nach einem Neustart wieder fängt.
Hat jemand ähnliche Erfahrungen mit RTX 4090 Karten gemacht?
Insbesondere:
Device Removed nach längerer Laufzeit
anschließende Desktop-Instabilität
normale Temperaturen
nur durch Undervolting/Limitierung verzögerbar
Ich bin für jede technische Einschätzung dankbar, insbesondere ob es bekannte Serienprobleme oder bekannte DX12-Treiber/GPU-Interaktionen gibt.
 
Zurück