Verzweifelte Fehlersuche: PCIe Lanes und ihre Abenteuer

Strangul

Schraubenverwechsler(in)
Servus,
Nach langem Überlegen wende ich mich doch mal an euch.
Seit geraumer Zeit plagt mich ein Problem mit meiner Grafikkarte (oder CPU, habs aber mal hier reingepackt).

tl;dr: Meine GraKa ist lediglich @x2 3.0 angebunden.

Das Problem besteht jetzt schon ein halbes Jahr, aufgefallen ist es mir zuerst bei KCD.
Ingame gab es plötzlich total wirre Frametimes und auch die FPS sind deutlich gefallen.
Das Steamforum brachte mir Spott ein, ich solle mir doch einen besseren PC kaufen =)
Irgendwann bin ich dahinter gekommen und merkte, dass meine GraKa nur noch mit x8 angebunden war.
Und bei der Fehlersuche schwand es auf x4 und ward dann gänzlich tot.
Okay, MB bestimmt kaputt. Also Slot gewechselt auf den physischen x8 und es lief einwandfrei.
Die Frametimes haben sich stabilisiert und die FPS waren wieder okay. Aber @ x8 eben.
(Es ist zwar nicht viel aber es gibt doch einen merklichen Unterschied bei der Performance.)
Also habe ich nun vor ein paar Monaten ein tolles neues, altes gebrauchtes Z170 Pro Gaming (selbes Ding wie vorher) erstanden.
Das alte Mainboard ausgetauscht und siehe da: Es läuft alles.
Bis ich gesehen habe, dass der 1. Slot nur mit 4 Lanes lief. Also geflucht und wieder den 2. Slot genutzt.
Aus Jux habe ich heute dann das alte MB noch einmal probiert und auf dem Karton (meine Benchstation :3) lief die GraKa einwandfrei mit x16 3.0!
Also völligst Begeistert ein paar Benches gemacht und das ganze bestätigt. Also alles eingebaut wieder und BUMM, x2 von neuem...
Erneut ausgebaut und weiterhin nur x2 Anbindung.

Und nun zur Problembeschreibung rundherum.

Mein System
CPU: 6700k
RAM: Ballistix 2x8GB 3000Mhz CL15
MB: Z170 Pro Gaming
SSD/HDD: 1x 480GB M.2, 1x 256GB Sata-SSD, 1x 2TB HDD
Grafikkarte: 1080Ti
Monitor: CH27HG70

Der 6700k werkelt meistens @4.6Ghz, im Sommer mal bei 4.5Ghz, im Winter bei 4.7Ghz bei ~1.35V (geköpft)
Der Arbeitsspeicher läuft @3200Mhz 15/16/16/32
Die Grafikkarte sowie die CPU sind Wassergekühlt.
Flüssigmetall ist i.O. auf dem Die.

Was ich bisher probiert habe:
-Frisches Windows mit neuen Treibern
-BIOS Reset (ganz oft....)
-CPU/RAM -> geht
-CPU/RAM/SSD -> geht
-CPU/RAM/SSD/SSD/HDD -> geht
-CPU/RAM/SSD/SSD/HDD/WLAN Karte -> geht
-CPU/RAM/SSD/GraKa -> am Anfang x16 dann x2
-Verschiedenste BIOS Einstellungen. Von Spannung bis Gen3 Force.
-CPU-Sockel ist i.O.

Eigentlich jede erdenkliche Kombination aus allem was ich habe und jeder Einstellung. Ich konnte die x16 Anbindung nicht mehr reproduzieren!
Alle Tests habe ich sowohl eingebaut als auch ausgebaut vorgenommen.
Das Einzige was ich nicht versucht habe: Luftkühlung auf die GraKa, statt der WaKü. Ebenso konnte ich keine zweite CPU Testen, da ich meinen zweiten 6700k weggegeben habe...

Bisherige Beobachtungen:
-Im 2. Slot funktioniert tadellos die x8 Anbindung auf beiden Boards (mehr ist auch nicht vorhanden)
-Zufälliger DRAM Fehler bei Boot (frisches BIOS), danach nicht wieder.
-Auf dem alten MB wurde die GraKa Zeitweise nicht erkannt
-Ebenfalls auf dem alten MB bootete der PC gar nicht mit der GraKa in Slot 1.
-Plötzlich lief es wieder, dann nichtmehr.
-Neues MB lief erst mit x8, dann x4, dann x2
-Altes MB ebenfalls x2 nachdem ich kurz die x16 hatte.
-OC immernoch Stabil (Prime95 ca. 12h)
-@Stock auch Stabil
-Temperaturen Ok
-Memtest findet keine Fehler (mehrere Durchläufe ._.)
-DRAM Fehler auf mehreren Boards mit verschiedenen RAM Kits in verschiedenen Slots
-Mein DP Kabel ist mir Kaputtgegangen in der Aufregung =(

Hier mal ein Vergleich des Unterschiedes von x16 auf x2
TimeSpy x2 vs x16.PNG
GPU-Z x2.PNG
Und bitte bitte, sagt mir nicht ich solle doch mal auf das Fragezeichen drücken und den Rendertest starten....


Ich weiß nicht, ob meine Grafikkarte das Problem ist, oder die CPU.
Falls es die CPU ist, muss es wohl verschoben werden =)
Vielleicht ist auch meine CPU Fritte. Würde man das nicht irgendwie feststellen können?
Und ist es irgendwie festzustellen ob der PCI Controller einfach dümpeln gegangen ist?
Wieso schafft es x8 auf dem 2. Slot aber keine x8 auf dem 1.?

Ich hoffe ich habe nichts vergessen. Ansonsten gebe ich gerne mehr Infos.

Danke schonmal für etwaige Hilfe und fürs Lesen von dem ganzen Text hier =)
 
Zuletzt bearbeitet:
Also wenn es ausserhalb des Gehäuses einwandfrei läuft und im Gehäuse nicht, dann liegt wohl irgendwo ein Fehler beim Einbau vor.
Eventuelle Kurzschlüsse bei der Slotblende, ein Distanzstück vom Board an der falschen Stelle etc.
 
Also wenn es ausserhalb des Gehäuses einwandfrei läuft und im Gehäuse nicht, dann liegt wohl irgendwo ein Fehler beim Einbau vor.
Eventuelle Kurzschlüsse bei der Slotblende, ein Distanzstück vom Board an der falschen Stelle etc.

Wie beschrieben lief es nur kurz einwandfrei.
Trotz des Aufbaus ausserhalb des Gehäuses läuft er wie innerhalb mit x2 auf Slot 1. bzw x8 auf Slot 2.
Er will auch nichtmehr die x16 annehmen. Egal wie :(
Kurzschlüsse habe ich auch schon vermutet, alles abisoliert, den Druck geprüft, die Abstände geprüft, Leitende Teile geprüft und nichts gefunden. Und da es auch ausserhalb nicht läuft, kann ich das ausschließen. Leider =(

Edit: Ich sehe gerade, dass ich das doof beschrieben habe. Ich änder das mal =)
 
Zuletzt bearbeitet:
Wie sehen denn die Kontakte an der Karte aus? Wie sehen die Kontakte von den Slots aus? PCIe Slots mal mit Druckluft gesäubert?
 
Ich vermute eher das dein oberer Slot defekt ist. Eventuell durch eine ganz leichte Biegung. Wenn du im 2Slot die x8 hast und oben macht er was er will hat es in meinen Augen der obere einen Schlag ab.
 
Kannst du mal ein Gpu-z zeigen bei dem der Rendertest zum hochtakten auch läuft


So sagt das GPU-Z nichts aus außer das die karte mit x16 angebunden ist und momentan im idle auf x2 ist
 
Es kann sehr gut, wie zuvor beschrieben, ein mechanisches Problem sein.
Ansonsten könntest du mal schauen ob die CPU @stock die Grafikkarte mit x16 erkennt.
Grund hierfür könnte sein, daß du beim OC im Zweifel auch das interne Bussystem übertaktet hast und dieses (im Zweifel auch in Verbindung micht verschlechterte kontaktierungen aufgrund von mechanischem Verschleiß) keine x16 mehr packt. Das ist dann ähnlich wie das man mit voll belegte RAM, also 4x8 GB weniger Geschwindigkeit fahren kann als bei 2x8 GB. Und bei pci könnten in diesem Fall einfach lanes die nicht 100% funktionieren abgeschaltet werden
 
Das sieht mir ganz stark nach einem Kontakt problem aus. Solche Sachen äußern sich idR. durch solche stochastisch auftretenden Fehler. Da es bei zwei Mainboards auftrat, tippe ich auf die Graka. Schau dir bitte die pci-e Steckerleiste an. Speziell im hinteren Bereich. Achte auf schmutz Ablagerungen, vielleicht sogar mech. Auffälligkeiten. Hat deine GraKa ein verbogenes p.c.b? Beschädigte kupfer kupferbahnen sieht man bei diesen multi layer boards nicht immer.
 
Wie sehen denn die Kontakte an der Karte aus? Wie sehen die Kontakte von den Slots aus? PCIe Slots mal mit Druckluft gesäubert?

Natürlich alles gereinigt. Auch mit Alkohol. Die Kontakte sehen super aus, bis auf leichte abnutzung.
Je nach Lichteinfall siehts natürlich wieder anders aus =D
IMAG1010.jpg
Ich vermute eher das dein oberer Slot defekt ist. Eventuell durch eine ganz leichte Biegung. Wenn du im 2Slot die x8 hast und oben macht er was er will hat es in meinen Augen der obere einen Schlag ab.

Es tritt auf beiden Boards auf!
Sowohl im eingebauten, wie auch im nicht eingebauten Zustand.
Ebenso kam es dazu, dass ich eine x16 Anbindung bekam und diese ja nicht reproduzieren konnte.
Habe ich aber alles beschrieben im Post.

Kannst du mal ein Gpu-z zeigen bei dem der Rendertest zum hochtakten auch läuft

So sagt das GPU-Z nichts aus außer das die karte mit x16 angebunden ist und momentan im idle auf x2 ist

Die Aussage ist nicht ganz richtig so. Im Idle wechselt es je nach Situation auf x16 1.1 oder x8 3.0. Der Screenshot ist zwar erstellt beim Rendertest (bin ja nicht doof) aber hier gerne nochmal in groß.

IMAG1013.jpg Render.PNG


Als nächstes werde ich mal die Grafikkarte nackig machen und so einbauen.
Die CPU läuft immoment stock und das Problem ist in allen Übertaktungsstadien.
VCCIO/VCCSA laufen stock, die brauch ich nur für höhere RAM-Regionen.
PCH ist auch unangetastet. So nötig hats der Chipsatz noch nicht :D
 
Ok .... hier stand Kram der sich soeben erübrigt hat durch neuen Post vom TE .....

Jetzt tippe ich eher darauf das die Karte nicht ganz gerade im Slot sitzt und einige Kontakte eben KEINEN Kontakt haben . Konnte solcherlei mal bei einem meiner eigenen Boards beobachten ... Karte "geradegedrückt" und so festgehalten und sie lief mit voller Anbindungsleistung , NICHT festgehalten und sie lief auf 8x ....
 
Ok .... hier stand Kram der sich soeben erübrigt hat durch neuen Post vom TE .....

Jetzt tippe ich eher darauf das die Karte nicht ganz gerade im Slot sitzt und einige Kontakte eben KEINEN Kontakt haben . Konnte solcherlei mal bei einem meiner eigenen Boards beobachten ... Karte "geradegedrückt" und so festgehalten und sie lief mit voller Anbindungsleistung , NICHT festgehalten und sie lief auf 8x ....

Habe mich gerade noch einmal versichert. Egal wie ich die Karte halte,stütze biege ( was für wilde Dinge). Es bleibt dabei, dass sie nur x2 läuft.
Ich prüfe aber mal das zweite Mainboard auch direkt nochmal =)
 
Also nachdem du ja einiges getestet hast udn der Fehler immer mit der Grafikkarte wandert könntest du, falls verfügbar, eine andere Grafikkarte einbauen und schauen wie die so angebunden wird
 
Der Screenshot ist zwar erstellt beim Rendertest (bin ja nicht doof)

habe ich ja auch nicht behauptet ;)

Aber egal ...jetzt weiß ich wenigstens worans liegt
Erstmal die behebung des Probs ..
Rechner auf die Seite legen
.Kühler von der CPU runter ...bügel aufmachen .....daumen auf die Cpu legen und dann an ihr rüttelnwährend sie im So liegt .... Bügel zu .kühler zum testen draufstellen und mal hochfahren

Sollte jetzt wieder funzen ansonsten wiederholen

Erklärung
Durch das Köpfen der CPU hat sich der Anpressdruck verringert da meistens das verkleben dünner erfolgt wie normal
Dadurch richten sich die Pins nicht korrekt aus so da das Kontaktflächen nicht mittig sonder seitlich ...schlimmstenfalls dazwischen getroffen werden
Ergebniss kennst du

Kann nätürlich sein das es das nicht ist aber bei meinen letzten 100 CPUs und noch ein paar Grakas mehr hatte ich öfter genau das Prob
dazu gesagt ...ich habe nur geköpfte CPUs

Und falls du dich wunderst wie ich auf so exterm hohe Zahlen komme .......

Overclocking, overclocking, and much more! Like overclocking.

es gibt nur 14 Menschen auf der Welt die mehr Ergebnisse abgeliefert haben wie ich ;)
 
Also nachdem du ja einiges getestet hast udn der Fehler immer mit der Grafikkarte wandert könntest du, falls verfügbar, eine andere Grafikkarte einbauen und schauen wie die so angebunden wird
Läuft genauso.
M2000.PNG
EDIT: Auch direkt mit beiden Boards getestet.

Aber egal ...jetzt weiß ich wenigstens worans liegt
Erstmal die behebung des Probs ..
Rechner auf die Seite legen
.Kühler von der CPU runter ...bügel aufmachen .....daumen auf die Cpu legen und dann an ihr rüttelnwährend sie im So liegt .... Bügel zu .kühler zum testen draufstellen und mal hochfahren

Sollte jetzt wieder funzen ansonsten wiederholen

Seit gestern Abend befindet sich der Aufbau an der frischen Luft noch. Gehäuse hat nur gestört beim ständigen Testen. ;)
Habs aber mal grad ausprobiert.
Ich rüttel dann gleich mal weiter. Bisher gabs damit keinen Erfolg :(

Als nächstes hilft wohl nur ne 2te CPU zum Testen.
 
Ich würde dir ja schnell einen celeron zum testen schicken ...liege aber momentan nach einer Herz OP im Krankenhaus :(

Wenn das nicht hilft CPU unterseite mit Aceton reinigen ...falls du das noch nicht gemacht hast

das wäre dann mein zweiter Ansatzpunkt

Und den dritten willst du nicht hören bzw erklärst mich dann für verrückt :D
 
Könnte ja auch am Grafiktreiber oder am Chipsatztreiber liegen, das der irgendein Powermanagement einschaltet und dann die Lanes abschaltet, um Strom zu sparen.

In den Windows Energieeinstellungen kann man dazu eine Funktion ein- und ausschalten.
 
Ich würde dir ja schnell einen celeron zum testen schicken ...liege aber momentan nach einer Herz OP im Krankenhaus :(

Wenn das nicht hilft CPU unterseite mit Aceton reinigen ...falls du das noch nicht gemacht hast

das wäre dann mein zweiter Ansatzpunkt

Und den dritten willst du nicht hören bzw erklärst mich dann für verrückt :D

Na zwar nicht mit Aceton weil grade keiner da aber Benzin immerhin.
Mache ich jedesmal wenn ich draufgepatscht habe, das triggert mich sonst nur =)
Habe den Anpressdruck grade mal erhöht und keine Besserung. Dafür habe ich 10°C weniger im Idle jetzt :D:D:D (WLPad ist grade drauf, saut weniger rum beim ständigen Wechseln)
Na dann hau raus den dritten und gute Besserung :o

Drück mal bei GPU-Z auf das Fragezeichen, was wird dann angezeigt?
Lol

Könnte ja auch am Grafiktreiber oder am Chipsatztreiber liegen, das der irgendein Powermanagement einschaltet und dann die Lanes abschaltet, um Strom zu sparen.

In den Windows Energieeinstellungen kann man dazu eine Funktion ein- und ausschalten.

Alte Treiber habe ich noch nicht probiert.
Habe auch schon die Energiespareinstellungen bearbeitet, sowohl im BIOS als auch in Windoof =)
Die Boards haben aber beide verschiedene BIOS versionen. Das eine ist schon gepatcht für die 7000er Generation.

Ich glaube inzwischen es liegt an der CPU. Ich schaue mich mal nach Ersatz um, bzw Testobjekten.
 
Zurück