GTX 980Ti spontan gestorben?

RRe36

Freizeitschrauber(in)
Hallo allerseits,
meine Gigabyte GTX 980Ti G1 ist scheinbar gestorben.

Erstmal die Konfiguration wie die Karte seit Kaufzeitpunkt (Juni 2015) bis jetzt lief (Werte aus dem GPU BIOS):

Base Clock: 1152.0MHz (zwecks Temperatursenkung bei 2D Last)
Boost Clock: 1240.0MHz
Realer Boost: 1259MHz (lag zu 100% unter 3D Last an)
Speichertakt: 3900MHz (die letzten Tage aber auf 3700MHz gesenkt, siehe weiter unten)
Spannung: 1.1V (Realwert unter Last waren i.d.R. 1,09V)
Powertarget: 300W
Temp Target: 79°C
Von Anfang an mit einem Arctic Accelero Xtreme III statt dem Werkskühler ausgestattet. Die Temperaturen lagen unter Last im Schnitt bei 60 bis 65°C bei ca. 70% Lüfterdrehzahl, im Leerlauf meist so 28°C bei 30% Lüfterdrehzahl.
Obrige Werte hab ich inklusive einer an den Accelero angepassten Lüfterkurve in das BIOS der Karte geschrieben (Maxwell BIOS Tweaker sei dank). Ansonsten keine physischen oder weiteren softwareseitigen Modifikationen.

Über die letzten drei Jahre lief die Karte mit diesen Einstellungen 100%ig stabil. Am Donnerstag hatte ich aber auf einmal einen spontanen Absturz als ich ein Video im MPC-HC mit madVR geguckt hab. Danach ging's eigentlich nur bergab und die Karte war auf einmal instabil. Ich hatte zuerst die VRM Kühlung vermutet, da ich wusste das der Kontakt zum Wärmeleitpad eher so mittelmäßig war. Hab dann infolge dessen Wärmeleitklebepads bestellt und die Kühlkörper auf den VRMs damit befestigt (etwas kleinere Kühlkörper, welche dafür aber auch nicht abfallen). Die Karte lief dann seit Freitag bis heute Vormittag soweit stabil.
Dann ist der Rechner heute spontan im Betrieb ausgegangen, als ich gerade ein bisschen was mit dem Unreal Engine 4 Editor gemacht hatte (vielleicht so eine Stunde lang). Seitdem schaltet sich der Rechner nicht mehr ein, sobald ich die Grafikkarte am Netzteil einstecke. Das Mainboard bekommt zwar Strom aber sobald ich den Einschaltbutton drücke haben die Lüfter der Grafikkarte kurz gezuckt und nichts passierte. Ohne Grafikkarte hat der Rechner problemlos gebootet (BIOS Code LCD des Crosshair). Sobald ich aber die Grafikkarte mit dem Netzteil verbinde ohne diese überhaupt in den PCIe Slot zu stecken startet nichts mehr.

Exkurs zu meinem be quiet E10-800W:
Das Netzteil klickt beim Starten und Ausschalten was laut be quiet irgendwelche Schutzschaltungen sind. Sobald ich versucht habe mit der Grafikkarte am Netzteil zu starten, hat das Netzteil zweimal geklickt (einmal zum Einschalten und einmal zum Abschalten würde ich vermuten).

Was ich alles probiert habe als die Karte instabil lief (in der Reihenfolge):

Speichertakt gesenkt => keine Veränderung
Spannung erhöht => GPU hat höher geboostet (1,27GHz)
Beides zusammen => keine Veränderung
Originalkühler von Gigabyte montiert => scheinbar Stabil (2h Spielebetrieb getestet), da hab ich die bessere VRM Kühlung vermutet, da der Windforce Kühler direkt aufliegt
Wandlerkühlung mit Accelero verbessert => scheinbar stabil, dachte Problem wäre gelöst
Hab das ganze mit dem Unigine Superpostion Benchmark und Just Cause 3 ausgetestet.

Was ich getestet habe nachdem der Rechner heute komplett abgeschmiert ist:

Grafikkarte entfernt => Rechner bootet
Anderes Netzteil mit Grafikkarte => Rechner bootet nicht (hab genau genommen zwei andere Netzteile ausprobiert weil ich die grad rumliegen hab, ein LC Power 650W und ein Corsair 850W. Beide funktionieren soweit ich weiß.)
Anderes Netzteil ohne Grafikkarte => Rechner bootet, also hab ich einen Fehler vom Netzteil ausgeschlossen
Grafikkarte nur mit den PCIe Stromsteckern verbinden, ohne in den PCIe Slot zu stecken => Rechner startet nicht
Andere Grafikkarte => Alles normal. Hab jetzt meine GTX 780 aus dem HTPC im Rechner und schreibe gerade mit dieser.

Die Platine der GTX 980Ti hab ich auf irgendwelche Schäden oder Ähnliches begutachtet und einen Speicherkühler der mir etwas nah an einem benachbarten Bauteil liegt bewegt und nochmal getestet, hat aber auch nichts gebracht.
Ich bin mangels sichtbarer Schäden an der Platine komplett ratlos was mit der Karte los ist. Hat jemand eine Idee woher das so spontan kommen könnte und ob ich da noch irgendwas testen sollte? Für eine neue Grafikkarte von dem Kaliber hab ich gerade nicht wirklich was übrig
frown3.gif
(wenn schon neu dann auch eigentlich richtig oder gar nicht damit sich das lohnt).


Danke für's lesen von diesem Textmonster
 
Hardware Schäden müssen nicht unbedingt äußerlich auffällig sein. Vermutlich ist ein Bauteil der Karte gestorben und das ganze Ding funktioniert nicht mehr. Das muss nicht unbedingt der Core, Ram oder die Spawas sein, sondern kann theoretisch auch was trivialeres sein. Was da defekt ist, ist aber schwer zu sagen.
 
Dann ist der Rechner heute spontan im Betrieb ausgegangen, als ich gerade ein bisschen was mit dem Unreal Engine 4 Editor gemacht hatte (vielleicht so eine Stunde lang). Seitdem schaltet sich der Rechner nicht mehr ein, sobald ich die Grafikkarte am Netzteil einstecke. Das Mainboard bekommt zwar Strom aber sobald ich den Einschaltbutton drücke haben die Lüfter der Grafikkarte kurz gezuckt und nichts passierte. Ohne Grafikkarte hat der Rechner problemlos gebootet (BIOS Code LCD des Crosshair). Sobald ich aber die Grafikkarte mit dem Netzteil verbinde ohne diese überhaupt in den PCIe Slot zu stecken startet nichts mehr.

Klingt nach einem Ausfall aufgrund einer kaputten/kalten Lötstelle. Das ist zwar selten, kommt aber vor, besonders bei High-End Karten mit hohen PowerTargets und vielen Temperaturzyklen. Du kannst versuchen, die Karte zu backen aber grundlegend ist das Ding sehr wahrscheinlich reif für die Tonne.
 
Das Ding zu Backen hab ich auch schon in Betracht gezogen. Hab die Karte aber bei nem Bekannten mit einem eigenem Hardware Laden gekauft und würde den erstmal fragen ob man da noch was wegen Garantie oder so drehen kann :)

Wenn dann isses aber bestimmt ne Lötstelle an den VRMs, da gabs garantiert etwas ausgiebigere Temperaturzyklen. Warum erübrigt sich ja *hust* Wärmeleitpad *hust*
 
Ja, aber tüte die Karte lieber in einen Bratenschlauch ein, oder sowas feuerfestes, denn Flussmittelrückstände, die verdampfen, sind nicht gesund... Und auch keine angekokelten Elkos :)
 
Ich glaub ich kenn sogar jemanden der Zugang zu nem Reflow Ofen hat. Vielleicht kann ich den ja mal dafür verwenden :ugly:

Wenn sich da Garantiemäßig nichts mehr drehen lässt könnte ich die Karte mal mit in die Uni nehmen. Wir haben da Labore mit Lötequipment und Geräten für Platinenfertigung/Reflowlötung. Ich als E-Technik Student darf diese ja mitunter gebrauchen :devil:
 
Zuletzt bearbeitet:
Hab die Karte jetzt mal im Laden eingeliefert. Vielleicht sieht er ja was das ich übersehen hab. Seine Theorie ist das da eventuell ein Bauteil auf der Platine verreckt ist. Mal gucken was am Ende rauskommt.
 
Naja Standard ist doch ca. 1,19V je nach Modell. Vielleicht hast du ein besseres Sample als ich aber ich konnte nicht nennenswert weiter runter ohne das es instabil wurde ;)
Ich hab da vielleicht auch eine empfindlichere Last drauf da ich die GPU zeitweise mit viel mehr als nur Spielen knechte (siehe UE4, 3ds Max und co.). So was schmiert sehr viel schneller ab.
Hab mir mal das original Gigabyte BIOS angeschaut, da waren 1,25V eingestellt, wie auch immer das mit den ursprünglichen 280W PT ernsthaft klappen sollte :what:
 
Kurzes Update: Das Teil wird voraussichtlich nächste Woche eingeschickt. Da ich ja erstmal meine 780 nutze macht mir ein längeres RMA Verfahren eh nichts aus.
 
So, Garantiemäßig gibt's nichts mehr, da seit zwei Monaten abgelaufen. Ist zwar etwas unglücklich aber ich schätze mal ich werde die Karte dann als nächstes Backen oder nen Reflow an den Lötpunkten machen. Parallel schiele ich aber auch auf Vega 64, da ich mir keine Karte für 800€ leisten kann und Vega sowieso ein interessantes Stück Technik ist (und schon ab Werk etwa 15-20% schneller als die 980Ti ist :P ). Abgesehen davon haben mittlerweile sowohl nVidia Karten als auch Vega ein gesperrtes VBIOS, nur braucht man bei AMD keine extra Software um Takt etc. zu ändern. Wegen der vermutlich höheren Lautstärke der Karte wird mir schon was einfallen, mein ACX III passt zwar nicht aber da kann ich mal kreativ werden :devil:
 
Zurück