[UPDATE] Tötete falsche Lagerung AMD-Grafikkarten? Verstörende Hinweise aus dem Repair-Shop

Aber jetzt schon mal die Frage: Warum erwähnt er das nicht? Und wer misst denn noch Memory, Mem-Controller und Soc durch, wenn das Die zerbrochen ist?
Also wenn meine Vermutung mit dem Bruch im Video korrekt ist, dann wahrscheinlich weil er es da noch nicht bemerkt hatte. :ka:
Kann man rein theoretisch denn irgendwie nachweisen das die Graka durch den Treiber kaputt gegangen ist??
Theoretisch kann man vieles, in der Praxis sieht es häufig aber anders aus. Aber wenn es der Treiber wäre, und zahlreiche User betroffen sind, dann würde damit der Nachweis ja eigentlich schon erbracht sein. Am Ende würde es aber an AMD bzw. dem Verkäufer der Graka liegen. Wenn die einen "technisch fundierten" Nachweis haben wollen, sprich ein handfestes Gutachten, dann bisste eh fertig. Möglich wäre ganz sicher zwar auch das, aber aus der Hüfte geschossen würde ich da irgendwas ab 5.000-10.000€ (?) für so ein "Gutachten" veranschlagen. "Forensische Diagnose" von Software und Hardware..., so lange keiner durch die Grafikkarte gestorben ist, wird sowas vermutlich keiner machen/finanzieren wollen.

Meine persönliche Einschätzung: Die defekten Karten abschreiben (vielleicht in eine Vitrine stellen?), wenn AMD/der Verkäufer sie nicht im Rahmen der Garantie/Gewährleistung (oder aus "Kulanz") umtauscht.
 
Dass die Karten den zu diesem Zeitpunkt aktuellen Treiber hatten kann natürlich auch Korrelation und nicht Kausalität sein.
Es wäre ja durchaus denkbar, dass Materialermüdung genau diesen Zeitraum nach Herstellung/Inbetriebnahme braucht um zu diesem Fehler zu führen.

Aber ja, natürlich ist es vollkommen in Ordnung die Chips die ganze Zeit kurz vor'm Thermal Throttling zu betreiben und die Grenze dafür auch großzügige 20 Kelvin höher anzusetzen als Mitbewerber mit dem gleichen Silizium und ähnlichen Prozessen von TSMC...
 
Also wenn meine Vermutung mit dem Bruch im Video korrekt ist, dann wahrscheinlich weil er es da noch nicht bemerkt hatte. :ka:
Tatsächlich wird es im Kommentar unter dem Video erklärt (danke @Darki24 im Luxx). Er wird von einem User auf den möglichen Riss hingewiesen, öffnet die Karte erneut und das Die zerbricht. Das sollten dann die Facebook-Bilder sein.

Dann ist das für diese Karte hinreichend geklärt, zumindest für mich. Was ist mit den anderen 47? Hat er da auch Risse übersehen?
 
Für mich siehts das eher so aus als hätte er da nen schönen Schwung Miningkarten erhalten. Ich kann mir kaum vorstellen das der Treiber die GPU killt. Die Karte aus dem Video hat auch einen gecrackten Die.
Kann ich mir auch nicht vorstellen. Ein tote GPU durch gleichmäßigen, undervolteten Mining Betrieb finde ich aber auch abwegig.

Aber ja, natürlich ist es vollkommen in Ordnung die Chips die ganze Zeit kurz vor'm Thermal Throttling zu betreiben und die Grenze dafür auch großzügige 20 Kelvin höher anzusetzen als Mitbewerber mit dem gleichen Silizium und ähnlichen Prozessen von TSMC...
Was meinst du damit?
 
@Birdy84 sollte nur ein ironischer Seitenhieb auf die Ryzen und Radeon 7000er sein, bei denen AMD skeptische Fragen zu hohen Temperaturen mit der selbstsicheren Antwort bedacht hat, dass das super sei – denn nur dann würde der Chip ja richtig ausgereizt und er sei schließlich dafür konzipiert. Während RDNA3 ab 110°C zum Schutz eingebremst wird, liegt dieser Wert bei Ada Lovelace bei 90°C.

Da die Unterschiede zwischen den von AMD und nVidia genutzten Prozessen diese Gen nicht so groß sind, deutet das für mich darauf hin, dass sie unterschiedliche Maßstäbe an "reduziert die Lebensdauer nicht maßgeblich" anlegen. Vielleicht sind diese Maßstäbe sogar so unterschiedlich, dass RDNA2 jetzt teilweise schon ausfällt. Der andere Punkt ist, dass über 100°C natürlich ein weiterer Problemfaktor hinzukommt, da plötzlich jedes Wassermolekül soviel Energie hat, dass es ~1500x soviel Platz braucht... Fairerweise muss man natürlich sagen, dass nVidia mit Ampère zuerst die 110°C heißen Speicherchips hatte, die dann manchmal gebremst haben. Nur ist ein 10 Watt-RAM-Chip halt keine kompliziert verpackte GPU mit hunderten Watt Energiefluss.
 
@Birdy84 sollte nur ein ironischer Seitenhieb auf die Ryzen und Radeon 7000er sein, bei denen AMD skeptische Fragen zu hohen Temperaturen mit der selbstsicheren Antwort bedacht hat, dass das super sei – denn nur dann würde der Chip ja richtig ausgereizt und er sei schließlich dafür konzipiert.
Ich verstehe nun, dass deine Antwort nicht ganz ernst gemeint war, aber das Ryzen 7000 Temperatur Thema ist nichts Neues, auch Ryzen 3000 und 5000 laufen unter hoher Last am thermischen Limit. Und da AMDs Server CPUs die gleichen maximalen Temperaturen haben, ist von einem Designproblem nicht auszugehen.

Während RDNA3 ab 110°C zum Schutz eingebremst wird, liegt dieser Wert bei Ada Lovelace bei 90°C. Da die Unterschiede zwischen den von AMD und nVidia genutzten Prozessen diese Gen nicht so groß sind, deutet das für mich darauf hin, dass sie unterschiedliche Maßstäbe an "reduziert die Lebensdauer nicht maßgeblich" anlegen. Vielleicht sind diese Maßstäbe sogar so unterschiedlich, dass RDNA2 jetzt teilweise schon ausfällt.
Die Vermutung ist aber auf dünnem Eis, solange du die Unterschiede der Fertigung und Nvidias Gründe für die Festlegung der Grenze nicht benennen kannst.
Unter 90°C oder 110°C sind normalerweise keine Temperaturen, wo Silizium dauerhaft geschädigt wird.

Der andere Punkt ist, dass über 100°C natürlich ein weiterer Problemfaktor hinzukommt, da plötzlich jedes Wassermolekül soviel Energie hat, dass es ~1500x soviel Platz braucht... Fairerweise muss man natürlich sagen, dass nVidia mit Ampère zuerst die 110°C heißen Speicherchips hatte, die dann manchmal gebremst haben. Nur ist ein 10 Watt-RAM-Chip halt keine kompliziert verpackte GPU mit hunderten Watt Energiefluss.
Aber was haben Wassermoleküle mit einem Silizium DIE zu tun?
 
Zuletzt bearbeitet:
Gut ,das ich meine RX 6700 XT verkauft habe,. Ich hatte eh als Probleme mit dem Treibern und jetzt lese ich das hier.
Einfach nur Traurig was AMD aktuell sich leistet.
 
Wie soll ein Treiber die Hardware beschädigen? Man sieht es doch sofort, wenn die Temperaturen steigen oder die Spannung zu hoch ist, wenn man den Treiber untersucht. Halte ich alles für Geschwätz. Zumal das Treiberdatum von vor vier Wochen überhaupt nicht ungewöhnlich ist. Gehe mit, dass die Karten wohl schon vorher schrott waren und vermutlich zum Minen oder anderer Dinge genutzt wurden und jetzt eben gesammelt eingetroffen sind.
 
Dann ist ja vielleicht gut wenn man nicht immer sofort den neuesten Treiber installiert.
Aber ich hoffe das die das bald fixen.
Ich halte es da wie unser @ RyzA.
Das Gezeter über aktuelle Treiber abwarten, entscheiden und dann installieren. Ich schaue mit vorher immer die Release notes an, um zu sehen, ob ich die "Verbesserungen" benötige oder nicht .Mein z.Z. verwendeter Treiber ist der 22.9.2. Läuft super damit und war bisher zu beqem einen Neuen zu installieren.
Wie soll ein Treiber die Hardware beschädigen? Man sieht es doch sofort, wenn die Temperaturen steigen oder die Spannung zu hoch ist, wenn man den Treiber untersucht. Halte ich alles für Geschwätz. Zumal das Treiberdatum von vor vier Wochen überhaupt nicht ungewöhnlich ist. Gehe mit, dass die Karten wohl schon vorher schrott waren und vermutlich zum Minen oder anderer Dinge genutzt wurden und jetzt eben gesammelt eingetroffen sind.
Gabs da nicht mal das Ding mit dem "Eject" im NV-Treiber, das Karten gehimmelt hat?
Gruß T.
 
Ich halte es da wie unser @ RyzA.
Das Gezeter über aktuelle Treiber abwarten, entscheiden und dann installieren. Ich schaue mit vorher immer die Release notes an, um zu sehen, ob ich die "Verbesserungen" benötige oder nicht .Mein z.Z. verwendeter Treiber ist der 22.9.2. Läuft super damit und war bisher zu beqem einen Neuen zu installieren.
Aber ich hatte da nochmal drüber nachgedacht: Das Treiber auch mal die Perfomance schmälern können, hatte ich schon mitbekommen. Oder zu Abstürzen bzw Blackscreens führen können. Hat es ja alles schon gegeben.
Doch die Hardware schädigen? Kann ich mir nicht wirklich vorstellen.
Mich würde auch mal die Meinung von AMD dazu interessieren. Und vor allem wenn das so stimmen würde, dann würden sie doch weitere Downloads des schädlichen Treibers unterbinden und schnellstens einen Fix anbieten. Die wollen ja ihre Karten weiterhin verkaufen.
 
Zuletzt bearbeitet:
AMD scheint sich mit KrisFix bereits in Kontakt zu befinden und möchte "weitere" Karten haben:


"Weitere" weil bereits betroffene Karten bei AMD vorhanden sind? Hmm...
 
In einer Computerbase Umfrage ist keine Häufung zu erkennen und da sind sicherlich auch viele User dabei die Benchmarks und dergleichen und Fehler rel. schnell erkannt werden.



Viele Grüße,
stolpi
 
Bei mir läuft der Treiber seit Mitte Dezember einwandfrei, kein Defekt auf der 6900XT selbst OC Versuche alles Reibungslos ohne Aufälligkeiten.

Auch längere Gaming Sessions über die Feiertage haben die Karte nicht kaputt gemacht, Leistung im 3D Mark ist auch nicht abgefallen. Temperaturen sind wie immer, Stomversorgung ist nicht erhöht und abgestürzt ist auch nichts.
 
Zuletzt bearbeitet:
Da hier sehr kuriose Vermutungen angestellt werden nochmal ganz deutlich für alle die mit dem Thema noch nichts zu tun hatten:

1. Beim ETH- /Bitcoin-Mining wird+wurde der Speicher belastet, nochmal DER Speicher.
2. Der GPU-Takt wird auf ein nötiges Minimum getaktet, teilweise 500 Mhz oder mehr unterhalb des Stock-Taktes.
3. Der Speichertakt wird weiter erhöht, sobald auch nur eine einzige Berechnung schiefgeht, sofort wieder reduziert.
4. Powertarget wird weiter gesenkt, um möglichst viele Berechnungen pro Watt zu erzielen.

Im Ergebnis ist da nun also eine Karte mit halbiertem GPU Takt, 65% ihres Powertargets und hochgezüchteten Grafikspeicher. Der wiederum mit jeder Berechnung unter Beweis stellt, korrekte Werte zu liefern.

Aber haltet einfach weiter am bösen Mining fest, wenn man sich mit dem Thema nur am Rande beschäftigt, siehe 1.-4., wird es allerdings schwer hier echte Zusammenhänge zu sehen.

Ein GPU-Chip nah am Leerlauf, stirbt auch bei 24/7 Betrieb nicht so effektvoll.


Mir ist bekannt, dass Karten zeitgleich mehrere Crypto's minen können, allerdings wird auch dann nicht mit 100% PT der Karte gearbeitet.

Ist irgendwo auch nicht angemessen, völlig unbekannten Leuten Mining zu unterstellen nur, weil einem das Fehlerbild nicht gefällt und Kritik am Hersteller offensichtlich unerwünscht ist.

Meine alte 2080 wurde auch zum Minen eingesetzt, dann wieder zum Spielen, danach für F@H.
Heute läuft die immer noch mit denselben OC' Werten beim Kumpel, täglich zum Spielen. Die Karte ist nun über 4 Jahre im Betrieb und hier sterben Karten, die 1,5 Jahre alt sind einfach so.
 
Zuletzt bearbeitet:
Ich stimme zu. Wenn eine Karte beim Mining stirbt, dann weil der Speicher verreckt ist oder weil der Miner die Karte nicht dafür getunt hat - was echt dumm wäre.
 
Zurück