Kann eine (Teil)defekte GPU andere Komponenten schädigen?

TE
TE
T

TriadFish

PC-Selbstbauer(in)
Jetzt möchtest du einen Youtuber finden, der aus der Geschichte ein Video macht, dafür deine Karte braucht und sie dir deshalb abtauscht gegen eine leicht bessere.

Oh ja, da hätte ich nichts dagegen ^^

Für mich ist es aber erstmal wichtig, dass das Problem nun identifiziert ist und es obendrein noch einen praktikablen Workaround gibt. Nach monatelanger Fehlersuche war ich schon fast davon übezeugt, dass das Problem nicht bei der GPU, sondern bei MB, RAM, CPU oder PSU zu suchen ist. Ich war schon kurz davor den ganzen PC an mindfactory zurück zu schicken, habe etliche Stunden mit Memtest, Prime, DDU, Checkdisc und Konsorten verbracht, habe etliche Bios Settings durchgetestet und einfach keinen Fehler gefunden.

Erst das Gegentesten im PC meines Kumpels hat dann wieder die Aufmerksamkeit auf die GPU gelenkt.

Für mich steht jetzt zumindest fest, dass ich mir nie wieder eine GPU von KFA2 oder Galax (ist exakt der selbe Mist, wie ich jetzt erfahren habe) kaufen werde. Ich hatte mir damals 2-3 Tests zu der Karte durchgelesen, die alle positiv waren und nur die magere Ausstattung und die etwas lauteren Lüfter bemängelten. Auf die verbauten Kondensatoren gehen solche Tests ja erst garnicht ein.
 

Downsampler

BIOS-Overclocker(in)
Diablo 2 Resurrected und das neue BF sind noch Beta-Software in irgendeinem Entwicklungsstadium.

Da kann jederzeit der CTD zuschlagen.
 
TE
TE
T

TriadFish

PC-Selbstbauer(in)
Nachdem ich knapp 2 Monate mit der o.g. Methode gut zurecht gekommen bin, zeichnet sich jetzt wohl langsam ab, dass sich das Problem verschlimmert. Ich hatte vor 3 Tagen den besagten Absturz beim Rein- und Raustabben aus Arma 3. Vorgestern dann noch einen kurz nach dem Betreten eines Servers in BF:BC 2. Beides Spiele, die ich relativ oft spiele und die bisher nie zu einem Absturz geführt haben.

Da ich in WQHD spiele und eine neue, halbwegs zukunftssichere GPU momentan mal locker mit 1000 € zu Buche schlägt, würde ich gerne eine Neuanschaffung so weit es geht hinaus zögern.

Da das Problem ja wie bereits festgestellt wurde, durch zu schwache (nachlassende) Kondensatoren verursacht wird, frage ich mich nun was ich tun kann um zu schnelle / zu hohe Taktsprünge der GPU zu verhindert. Das Problem ist nicht, dass die GPU ihren maximalen Takt nicht halten kann, sondern eben ein zu schneller Taktsprung, den die Kondensatoren nicht abfedern können.

Eine bloße Reduktion des maximalen GPU-Takts hatte in der Vergangenheit nicht geholfen. Hat Jemand vielleicht eine Idee, was man noch versuchen könnte?

BF:BC 2 lief z.B. gestern nach erfolgreichem Betreten eines Servers 2 Stunden lang ohne Probleme mit konstant 200FPS (Hardcap der Engine). Das Problem ist nur der Moment, in dem man ins Spiel kommt und die GPU auf einmal von fast 0 auf maximum aufdreht.
 
W

whiteshadow81

Guest
Nachdem ich knapp 2 Monate mit der o.g. Methode gut zurecht gekommen bin, zeichnet sich jetzt wohl langsam ab, dass sich das Problem verschlimmert. Ich hatte vor 3 Tagen den besagten Absturz beim Rein- und Raustabben aus Arma 3. Vorgestern dann noch einen kurz nach dem Betreten eines Servers in BF:BC 2. Beides Spiele, die ich relativ oft spiele und die bisher nie zu einem Absturz geführt haben.

Da ich in WQHD spiele und eine neue, halbwegs zukunftssichere GPU momentan mal locker mit 1000 € zu Buche schlägt, würde ich gerne eine Neuanschaffung so weit es geht hinaus zögern.

Da das Problem ja wie bereits festgestellt wurde, durch zu schwache (nachlassende) Kondensatoren verursacht wird, frage ich mich nun was ich tun kann um zu schnelle / zu hohe Taktsprünge der GPU zu verhindert. Das Problem ist nicht, dass die GPU ihren maximalen Takt nicht halten kann, sondern eben ein zu schneller Taktsprung, den die Kondensatoren nicht abfedern können.

Eine bloße Reduktion des maximalen GPU-Takts hatte in der Vergangenheit nicht geholfen. Hat Jemand vielleicht eine Idee, was man noch versuchen könnte?

BF:BC 2 lief z.B. gestern nach erfolgreichem Betreten eines Servers 2 Stunden lang ohne Probleme mit konstant 200FPS (Hardcap der Engine). Das Problem ist nur der Moment, in dem man ins Spiel kommt und die GPU auf einmal von fast 0 auf maximum aufdreht.
Deine Karte drehte also die Lüfter voll auf und der Bildschirm wurde dunkel aber im Hintergrund lief alles normal weiter?

Da habe ich deine CPU im Verdacht und nicht die VGA. Was sagt denn die Hardware Ereignisanzeige? Ich vermute hier deine CPU bekommt eine Spur zu wenig Saft. Hast du das aktuelle Bios aufgespielt für dein Board?

Wenn nicht mach es mal, wenn doch erhöhe im Bios einmal die CPU Spannung ein ganz kleines wenig also um 0,02 z.B. Also wenn deine CPU 1,30V nimmt dann probiere es mal 1,32V
 
TE
TE
T

TriadFish

PC-Selbstbauer(in)
Deine Karte drehte also die Lüfter voll auf und der Bildschirm wurde dunkel aber im Hintergrund lief alles normal weiter?

Da habe ich deine CPU im Verdacht und nicht die VGA. Was sagt denn die Hardware Ereignisanzeige? Ich vermute hier deine CPU bekommt eine Spur zu wenig Saft. Hast du das aktuelle Bios aufgespielt für dein Board?

Wenn nicht mach es mal, wenn doch erhöhe im Bios einmal die CPU Spannung ein ganz kleines wenig also um 0,02 z.B. Also wenn deine CPU 1,30V nimmt dann probiere es mal 1,32V

Nein, wie hier im Thread ja bereits festgestellt wurde, ist es eindeutig die GPU. Das Fehlerbild war im PC eines Freundes 1:1 reproduzierbar. Es läuft auch nichts im Hintergrund weiter, der PC hat einen vollen Absturz, Leute im TS hören mich dann auch nicht mehr, Sound des Spiels ist auch weg. Es ertönt noch kurz der Windows Sound, der auch kommt wenn man einen USB Stick einsteckt, das wars dann. Es leuchtet nichtmal eine Fehler-LED auf dem Board.

CPU und RAM hatte ich schon mehrfach durchgetestet. bestehen Diverse Stresstests ohne Probleme. Das aktuelleste Bios ist auch drauf.
 
W

whiteshadow81

Guest
Nein, wie hier im Thread ja bereits festgestellt wurde, ist es eindeutig die GPU. Das Fehlerbild war im PC eines Freundes 1:1 reproduzierbar. Es läuft auch nichts im Hintergrund weiter, der PC hat einen vollen Absturz, Leute im TS hören mich dann auch nicht mehr, Sound des Spiels ist auch weg. Es ertönt noch kurz der Windows Sound, der auch kommt wenn man einen USB Stick einsteckt, das wars dann. Es leuchtet nichtmal eine Fehler-LED auf dem Board.

CPU und RAM hatte ich schon mehrfach durchgetestet. bestehen Diverse Stresstests ohne Probleme. Das aktuelleste Bios ist auch drauf.
Ich kenne dieses Fehlerbild nur von der CPU her. Wenn die Grafikkarte verabschiedet kommt ein Bluescreen oder Windows geht quasi in einen Schutzmodus und zeigt an das der Treiber zurückgesetzt wurde z.B.

Das was du oben alles gemacht hast mit Takt runter usw halte ich für Zufall das es geklappt hat. Was sagt die Ereignisanzeige?

Stresstest für CPU sagt mal nicht alles aus! Kann meine VGA massivst übertakten und es läuft ohne Probleme zb durch den Bench aber im Game ist es dann vorbei.

Genauso CPU wenn ich da die Spannung runter regle funktioniert es im Bench und in 5 Games und bei 3 wieder nicht. Hier wäre es super wenn du die Ereignisanzeige uns berichtest. Du müsstest natürlich die Uhrzeit wissen damit du das richtige Ereignis findest.
 
Zuletzt bearbeitet von einem Moderator:

IICARUS

Kokü-Junkie (m/w)
Habe nicht das ganze Thema durchgelesen, da es schon eine Weile her ist. Kenne solche Fehler auch nur von einem instabilen System oder wenn das Netzteil zusammenbricht. Solange du nicht die richtige Ursache ermitteln kannst, drehst du dich ehe nur im Kreis und besser wird es garantiert nicht.

Was du da schreibst, kenne ich von keiner defekten Grafikkarte. Setze mal dein BIOS auf Werkseinstellungen zurück und teste es dann mit Stock Einstellungen. Dass du das Problem eher in einem Zeitraum hast, wo was gestartet oder geladen wird, deutet auch eher auf einen instabilen Prozessor oder instabile Arbeitsspeicher hin.

Mit der Grafikkarte müsste schon der Treiber dazu abstürzen.
Um Software auszuschließen, würde ich mal das System komplett neu aufsetzen.
 
Zuletzt bearbeitet:

Birdy84

Lötkolbengott/-göttin
Leute, das Problem tritt identisch in zwei unterschiedlichen PCs auf. D.h. es liegt an der Karte.

Ich würde im MSI AB mit Strg+F die Taktkurve aufrufen und auf ihr einen Punkt wählen, der einen Takt markiert, den die Karte auch unter sehr hoher Last, wie Metro Exodus oder Control, hält. Dann mit Strg+L diese Taktstufe fixieren. Damit müsste der Lastwechsel zwischen Idle und 3D Anwendung etwas weniger stark ausfallen.

Aber auch das ist bestenfalls ein vorrübergehender Workaround.
 

IICARUS

Kokü-Junkie (m/w)
Leute, das Problem tritt identisch in zwei unterschiedlichen PCs auf. D.h. es liegt an der Karte.
Kann was zu bedeuten haben, muss es aber nicht.
Vielleicht haben beide zufällig instabile Systeme und der Fehler tritt dann auch auf diesem System auch auf. Der Kumpel hat auch nur eine 970 Grafikkarte verbaut und wird möglicherweise nicht in diesem Lastzustand kommen.

Für mache Leute ist das System bereits stabil, sobald Windows startet. :D

Nochmal, es sind keine typischen Fehler, die von einer defekten Grafikkarte verursacht werden, da kann er von mir aus 1000 Systeme damit ausgetestet haben und deshalb bleibe ich auch dabei. Der nächste Schritt meinerseits wäre, einfach das Thema zu ignorieren und ihm seinen eigenen Lauf geben... aber dann wird er sich in 1 Monat erneut mit demselben Problem melden. :P
 

Birdy84

Lötkolbengott/-göttin
Kann was zu bedeuten haben, muss es aber nicht.
Vielleicht haben beide zufällig instabile Systeme und der Fehler tritt dann auch auf diesem System auch auf. Der Kumpel hat auch nur eine 970 Grafikkarte verbaut und wird möglicherweise nicht in diesem Lastzustand kommen.
Natürlich besteht ein theoretische Chance. Die ist aus meiner Sicht extrem gering, da sich der Fehler über den 3D Mark so präzise reproduzieren lässt und das System in anderen Fällen stundenlang läuft. Mit instabiler CPU oder instabilem RAM oder Netzteil, würde man früher oder später auch auf Fehler treffen. Das ist hier aber nicht der Fall.

Für mache Leute ist das System bereits stabil, sobald Windows startet. :D
Das Gefühl habe ich bei manchen auch. :-)

Nochmal, es sind keine typischen Fehler, die von einer defekten Grafikkarte verursacht werden, da kann er von mir aus 1000 Systeme damit ausgetestet haben und deshalb bleibe ich auch dabei.
Natürlich trifft man auf ähnliche Symptome auch bei instabilen CPUs durch schwankende Last. Ein ähnliches Symptom musst Nvidia kurz nach dem Ampere Launch beheben, weil Karten kurzzeitig zu hoch takteten.
 

IICARUS

Kokü-Junkie (m/w)
Er soll ja noch ein paar Sachen nachgehen, was ich vorgeschlagen habe, um einfach ein instabiles System und Software Problem mit ausschließen zu können. Falls ein anderes Netzteil da wäre, würde ich es auch mal damit austesten.

Bei Kumpels denke ich auch... ich habe auf 5 GHz übertaktet und der nächste will es auch und vielleicht haben dann beide ein instabiles System.

Hatte mal eine Grafikkarte, wo ständig in Games der Treiber abstürzte. Hatte auch Windows neu aufgesetzt und die Grafikkarte sogar eingesendet gehabt. Die Grafikkarte kam aber ohne Austausch zurück, da sie kein Fehler finden konnten. Danach bekam ich den Tipp mal 3DMark 11 auszutesten, da dieser Test auch den Prozessor stark auslastet.

Mit anderen Benchmark oder Stresstests konnte ich diesen Fehler nicht nachstellen und damals hatte ich noch ein Xeon verbaut, der nicht übertaktet war. Die Grafikkarte (GTX 770) selbst war auch nie übertaktet. Aber mit 3DMark 11 ging der Rechner sogar immer an derselben Stelle aus. Nachdem ich mir ein neues Netzteil verbaut, war das Problem weg.

Hatte mir aber damals bereits eine neue GTX 980 Grafikkarte für den Übergang gekauft und daher verkaufte ich dann die GTX 770.
 
Zuletzt bearbeitet:
W

whiteshadow81

Guest
Leute, das Problem tritt identisch in zwei unterschiedlichen PCs auf. D.h. es liegt an der Karte.

Ich würde im MSI AB mit Strg+F die Taktkurve aufrufen und auf ihr einen Punkt wählen, der einen Takt markiert, den die Karte auch unter sehr hoher Last, wie Metro Exodus oder Control, hält. Dann mit Strg+L diese Taktstufe fixieren. Damit müsste der Lastwechsel zwischen Idle und 3D Anwendung etwas weniger stark ausfallen.

Aber auch das ist bestenfalls ein vorrübergehender Workaround.
Und ich halte es für unrealistisch das er jetzt damit zocken konnte und nun kommt der gleiche Fehler. Was soll er jetzt machen? Jede Woche den Takt um 50mhz senken!?

Ich bin da was Icarus geschrieben hat der gleichen Meinung und vielleicht bekommen wir ja noch den Fehler der Ereignisanzeige
 

IICARUS

Kokü-Junkie (m/w)
Für mich ist es kein typisches Zeichen einer defekten Grafikkarte.

Entweder stimmt was Softwareseitig was nicht und da nehme ich auch die Treiber des Systems mit dazu. Daher würde ich hierzu das System einmal sauber neu aufsetzen. Falls du eine freie Festplatte oder SSD hast, könntest du die Systemplatte abklemmen und auf ein anderes Laufwerk alles zum Testen neu einrichten.

Hierbei auch mal alles aus dem Bios zurücksetzen und auch mal schauen, ob es ein aktuelles Bios beim Hersteller gibt. Hiermit soll ein instabiles System ausgeschlossen werden. Zu guter Letzt würde ich noch ein anderes Netzteil austesten.
 

Birdy84

Lötkolbengott/-göttin
Für mich ist es kein typisches Zeichen einer defekten Grafikkarte.
Dem stimme ich zu. Das nun eine andere Komponente in den zwei Computern genau das gleiche Symptom hervor rufen und auch nur, wenn besagte Graka verbaut ist, finde ich allerdings abwegiger.
Ich hab hier übrigens eine 980Ti im Regal stehen, die mit zunehmender Laufzeit immer schneller kein Bild mehr ausgibt, nachdem 3D Last anliegt. Würde ich auch nicht grade als typischen Fehler ansehen.
 
TE
TE
T

TriadFish

PC-Selbstbauer(in)
Es ist definitiv die GPU:

- Der 3D Mark Mesh Test Crasht zu 100% knapp 1 Sekunde nach Start des Tests auf 2 verschiedenen Systemen mit dem selben Fehlerbild.

- Wenn ich vorher den Furmark anwerfe und im Hintergrund laufen lasse. läuft der Mesh Test problemlos durch, ganz einfach weil Furmark den GPU Takt langsamer hoch dreht und die Kondensatoren nicht überfordert

- Die GPU läuft ansonsten absolut problemlos, keine Grafikfehler, keine Mikroruckler, keine auffälligen Temps, auch nicht bei stundenlangem Spielen unter Volllast

- Probleme gab es bisher immer nur beim 3D Mark Mesh Test, bei BF 2042 und bei D2R - immer beim Laden / sehr kurz nach dem Laden des Spiels / Tests, undzwar immer dann wenn es zu schnelle Taktsprünge der GPU gab. Ist der Takt einmal oben läuft die GPU absolut ohne Probleme. Ich habe das genau beobachtet.

- Mittlerweile hatte ich auch einen Crash beim betreten einer Map in BF: BC 2 und beim rein/raustabben bei Arma 3, also auch in Situationen, in denen die GPU von wenig auf hohe Last springt. Auch diese Crashes werden sich dadurch umgehen lassen, wenn der Furmark im Hintergrund läuft.

- Der Rest des Systems ist neu, mein NT ist mehr als stark genug. CPU und RAM haben etliche Stresstests durchlaufen, habe alles Probiert. Powerlimit der CPU drastisch reduziert, RAM auf 2133Mhz runtergetaktet, Timings erhöht... bringt alles nichts. Es hat damit absolut 0 zu tun.


Ihr dürft hier nicht von den typischen GPU-Defekten ausgehen (defekter VRam, defekter Grafikchip). Da hat man dann Grafikfehler, Bluescreens und dergleichen. Bei mir bricht einfach für einen kurzen Moment die Stromversorgung der GPU zusammen und das führt zu einem vollen Absturz, weil die Kondensatoren zu schwach sind und schnelle Taktsprünge nicht abfedern können.
 
Zuletzt bearbeitet:
W

whiteshadow81

Guest
Es ist definitiv die GPU:

- Der 3D Mark Mesh Test Crasht zu 100% knapp 1 Sekunde nach Start des Tests auf 2 verschiedenen Systemen mit dem selben Fehlerbild.

- Wenn ich vorher den Furmark anwerfe und im Hintergrund laufen lasse. läuft der Mesh Test problemlos durch, ganz einfach weil Furmark den GPU Takt langsamer hoch dreht und die Kondensatoren nicht überfordert

- Die GPU läuft ansonsten absolut problemlos, keine Grafikfehler, keine Mikroruckler, keine auffälligen Temps, auch nicht bei stundenlangem Spielen unter Volllast

- Probleme gab es bisher immer nur beim 3D Mark Mesh Test, bei BF 2042 und bei D2R - immer beim Laden / sehr kurz nach dem Laden des Spiels / Tests, undzwar immer dann wenn es zu schnelle Taktsprünge der GPU gab. Ist der Takt einmal oben läuft die GPU absolut ohne Probleme. Ich habe das genau beobachtet.

- Mittlerweile hatte ich auch einen Crash beim betreten einer Map in BF: BC 2 und beim rein/raustabben bei Arma 3, also auch in Situationen, in denen die GPU von wenig auf hohe Last springt. Auch diese Crashes werden sich dadurch umgehen lassen, wenn der Furmark im Hintergrund läuft.

- Der Rest des Systems ist neu, mein NT ist mehr als stark genug. CPU und RAM haben etliche Stresstests durchlaufen, habe alles Probiert. Powerlimit der CPU drastisch reduziert, RAM auf 2133Mhz runtergetaktet, Timings erhöht... bringt alles nichts. Es hat damit absolut 0 zu tun.


Ihr dürft hier nicht von den typischen GPU-Defekten ausgehen (defekter VRam, defekter Grafikchip). Da hat man dann Grafikfehler, Bluescreens und dergleichen. Bei mir bricht einfach für einen kurzen Moment die Stromversorgung der GPU zusammen und das führt zu einem vollen Absturz, weil die Kondensatoren zu schwach sind und schnelle Taktsprünge nicht abfedern können.
Sorry aber nochmals was sagt die Windows Ereignisanzeige???

Denn genau das was du beschreibst ist alles nicht schlüssig. Du kannst Stundenlang spielen unter Vollast und dann tritt das ganze bei Benches auf und bei 2 anderen Punkten.

Das kann dann auch das NT sein, siehe hier von einem User der sich eine RX 6900XT kaufte und ständig probleme hatte und auch nur bei 2 Programmen. Dann hat er für die Karte am NT umgesteckt und siehe da es läuft. Seit dem keine Meldung mehr bei ihm.

Dein NT kann schon genug Power haben keine Frage aber so wie du meinst es ist die GPU meinen andere es liegt eventuell am NT oder an der CPU oder am Ram usw. Und so wie du meinst die Kondensatoren an der Graka haben einen weg kann das auch auf dein genug Power NT zutreffen. Keiner weiß was dein Kumpel für ein Setting hat, was für ein NT usw.

Es ergibt auch wirklich null Sinn das wenn du vorher Furmark startest das du dann den Mesh machen kannst. Entweder die Karte ist kaputt wie du schreibst und schmiert da immer ab oder wenn ich vorher Furmark laufen lasse und danach kann ich fröhlich Mesh durchlaufen lassen ist die Karte von Furmark repariert?? Nöö sorry das ergibt wirklich keinen Sinn.

Und wenn du schon schreibst bei niedriger auf hohe Last passiert dies wäre das NT sogar schon fast mein Favo in deinem Fall.
 
Zuletzt bearbeitet von einem Moderator:

IICARUS

Kokü-Junkie (m/w)
Wenn ich vorher den Furmark anwerfe und im Hintergrund laufen lasse. läuft der Mesh Test problemlos durch, ganz einfach weil Furmark den GPU Takt langsamer hoch dreht und die Kondensatoren nicht überfordert
Das ist Quatsch, das einzige, was dabei passiert ist, dass keine so hohe Spannungsspitze erzeugt werden und deutet sogar aufs Netzteil hin! Was glaubst du weshalb in Benchmark oder Stresstests solche Fehler schwer nachgestellt sind? Weil ständig eine hohe Dauerlast anliegt und kein großer Lastwechsel erzeugt wird und die Last sich deshalb die ganze Zeit im oberen Bereich hält! Dadurch fallen dann auch die Spannungsspitzen, die erzeugt werden, geringer aus.

Es ist definitiv die GPU:
Aber wenn du so davon überzeugt bist, was willst du von uns? :huh:
Kauf dir doch eine neue Grafikkarte und dann sollte es deiner Meinung nach, gut sein.

Mir ist auch nicht bekannt, was dein Freund für ein System verbaut hat, vielleicht hat er solch ein Netzteil verbaut, was mit deiner Grafikkarte zum selben Problem führt, denn mit seiner GTX 970 wird sein System nicht so stark belastet, sodass dann sein Netzteil auch dazu ausreichen wird.

Hatte dir geschrieben mal das System neu aufzusetzen und Werkseinstellungen auszutesten, bevor du was mit dem Netzteil versuchst. Was ist daran schwer, auch diesen Bereich ausgrenzen zu können.?!

Bin aber jetzt raus, ist dein Problem und wenn du nicht auf Ratschläge hörst, dann scheinst du manches besser zu wissen und brauchst ja dann auch keine Hilfe. :ugly:
 
TE
TE
T

TriadFish

PC-Selbstbauer(in)
Ich verstehe ja, dass es jetzt lästig ist den ganzen Thread nochmal durchzulesen, um zu verstehen, was zu der Angelegenheit in Sachen Fehlerdiagnose bereits Alles gelaufen ist. Ich zitiere hierzu einmal 4ThVariety, der das Problem für mich analysiert hat. Absolut Alles deutet darauf hin, dass er damit Recht hat. Auch sein in einem späteren Beitrag genannter zusätzlicher Lösungsansatz funktioniert.

Wie ist folgendes mit einem defekten Netzteil, defekter CPU, RAM, Mainboard oder einem korrumpierten Windows zu erklären?:

Der 3D Mark Mesh Test crasht zu 100% ca. 1 Sekunde nach Start des Tests aber er läuft ganz normal durch, wenn ich den Furmark im Hintergrund laufen lasse, sodass die GPU bereits hochgetaktet ist, wenn der Mesh Test startet

Und nochmal: Exakt selbes Fehlerbild in einem stabil laufenden PC eines Freundes. Ja, er hat nur ne 970, aber meine 2060S ist nur das kleine Modell von KFA2 mit nur einem 8-Pin Anschluss. Ich bezweifel, dass die großartig mehr Saft ziehen will als seine OC-Version der 970 mit 3 Lüftern.

Hinzu kommt die Tatsache, dass die Crashes über Monate hinweg immer bei den exakt selben Anwendungen zum exakt selben Zeitpunkt aufgetreten sind. Undzwar immer genau dann, wenn die GPU plötzlich hochtaktet. Ich habe es wie gesagt lange beobachtet.

Ich finde es ja nett, dass ihr mir helfen wollt, aber es geht nicht darum den Fehler zu finden, denn den kenne ich schon. Ich wollte einfach nur nach alternativen Möglichkeiten fragen eine Überlastung der Kondensatoren zu vermeiden.


Linke Spalte geht von grün nach gelb, von 1080 auf 1470Mhz. Diesen Ramp Up gibt es nur für zwei Zeilen, wenn die Karte crasht. Da liegt der Hund begraben.

Die Spalte Boardpower hat ihren Ramp Up jedoch verzögert, und erst wenn der RAM von 1470 auf 1890Mhz geht. Bedeutet, den ersten Ramp Up von 1080 auf 1470 bezahlt die Karte indem Kondensatoren entladen werden. Das sieht man daran, dass alle anderen Metriken erst anziehen, wenn die Karte auf 1890MHz geht.

Ganz rechts in der Voltage sieht man auch, dass die Karte erst auf mehr Voltage (1.037V) geht, wenn der Sprung auf 1890MHz erfolgt Bei diesem Sprung geht der 2060 Chip vom PerfCap Reason 16 (Idle), sofort in den PerfCap 04 (limited by max operating voltage). Die Karte (als Ganzes) ist am Maximum der Volt die gerade gehen und sollte sie in dem Moment mehr Volt brauchen, (weil zum 2060 Chip auch noch die Elektronik außenrum gerade übermäßig Strom zieht) wird es dunkel. Spannung bricht ganz zusammen, und aus. Beim Absturz ist das der Hilfeschrei, den wir im Log nicht sehen.

Im Crash Log aus dem vorherigen Post geht der Takt auch zwei Einträge lang hoch, aber die Spannung geht noch nicht hoch. Das erste Hochtakten im Verbund mit dem Umschalten der Karte von Idle auf halbe TDP saugt also die Karte komplett leer und crasht das System, bevor die Spannungsversorgung reagieren kann und insgesamt hochregelt.

Das ist nicht ideal, denn vermutlich braucht die Karte an der Stelle mehr um diesen Anstieg abzufangen der durch das Hochfahren der Karte im Verbund mit dem Entladen der Kondensatoren entstanden ist. Vermutlich hat der Hersteller damit nicht gerechnet, denn später sehen wir wenn die Karte auf 125W geht sinkt die Spannung sogar und das PerfCap wechselt auf 1 (imited by temperature limit.). KFA2 könnte daher geneigt sein zu glauben die Reaktionsfähigkeit der Spannungsversorgung wäre gut genug, wenn sie das in Wirklichkeit nicht ist. KFA2 könnte auch glauben, dass man weniger Kondensatoren zum Spannungsausgleich braucht als Nvidia das gesagt hat, weil man ja eh am TDP Limit ist und nicht am Spannungslimit. Auch falsch.

Fehlerursache sind also eine Spannungsversorgung mit zu wenig Reaktionsgeschwindigkeit, oder (was wahrscheinlicher ist) zu wenige Reserve in Kondensatoren nahe dem Chip. Ich erinnere nur an die 3080 Diskussion mit den Kondensatoren auf dessen Rückseite.

Gute Nachricht: dem PC sollte das ebensowenig schaden, als würde man einfach den Resetknopf drücken. Die GPU schaltet aus Panik ab und der PC macht mit. Schreibfehler auf der SSD die ihren Cache nicht mehr in den Flash geschrieben bekommt und eine Windows Installation die deswegen nicht mehr bootet, sind hier der schlimmste Fall.

Schlechte Nachricht: so richtig eine gute Lösung gibt es nicht. Auf Hardwareebene wird sich das nicht nachträglich fixen lassen. Da müsste man schon ein neues Bios für die Karte programmieren, das wird nicht passieren.

Mittelmäßige Lösung:
Die Karte springt von 1080 -> 1470 (+390) -> 180 (+405)
Dieser Sprung braucht manchmal in der Summe zu viel Energie die nicht von den Kondensatoren geliefert werden können, bevor die Spannungsversorgung Gas gibt.
Aus den Logs sehe ich aber auch, dass bei 125W TDP die Karte bestenfalls bei 1800MHz läuft.

Dann nehmen wir doch gleich 1750 als neues Limit., vor allem weil das synchron mit dem Mem Clock wäre.
Das Verhalten der Karte in zwei Sprüngen auf 1750 zu gehen werden wir nicht ändern können, ebensowenig, dass die Karte den ersten Sprung aus zu wenig Kondensatorenpower bezahlen will. Aber die Sprünge sind kleiner (335), vielleicht reicht das ja aus. Wir wissen ja, dass die Karte gerade so an der Grenze ist, den Sprung manchmal zu schaffen und manchmal nicht.

Einen Undervolt sollten wir dann aber nicht fahren, das PerfCap hätte gerne jetzt schon mehr an entscheidender Stelle.
 
Zuletzt bearbeitet:

IICARUS

Kokü-Junkie (m/w)
Ich finde es ja nett, dass ihr mir helfen wollt, aber es geht nicht darum den Fehler zu finden, denn den kenne ich schon. Ich wollte einfach nur nach alternativen Möglichkeiten fragen eine Überlastung der Kondensatoren zu vermeiden.
Was willst du ständig mit diesen Kondensatoren?! Bist du Elektriker, hast du alles durchgemessen?

Ich verstehe ja, dass es jetzt lästig ist den ganzen Thread nochmal durchzulesen, um zu verstehen, was zu der Angelegenheit in Sachen Fehlerdiagnose bereits Alles gelaufen ist. Ich zitiere hierzu einmal 4ThVariety, der das Problem für mich analysiert hat.
Habe eigene Kenntnisse und muss nicht andere Meinungen teilen. Mir sind seine Beiträge bekannt und von mir hast du eigene Lösungsansätze bekommen. Keine Ahnung was du jetzt willst, kaufe dir also eine neue Grafikkarte.

Wenn für dich soweit alle klar ist, verstehe nicht ganz worauf du noch hinaus willst!
 
Zuletzt bearbeitet:
W

whiteshadow81

Guest
Ich bin auch raus hier! Deine Erklärung warum es die Karte ist, sind mir nicht schlüssig und ergeben keinen Sinn.

Deine Kernfrage ob du damit andere Hardware beschädigt werden kann wurde beantwortet und das mit dem zweiten Anliegen ist für dich geklärt und das ist so für dich dann ist es ja gut.
 
Oben Unten