Blog Alkis Blog #19 - OC? Du hast doch'n Atom am wandern!

Incredible Alk

Moderator
Teammitglied
Man verzeihe mir die leicht provokante Überschrift (und den mal wieder ellenlangen Blog), es geht hier sicher nicht darum die Nachteile des Übertaktens an die Wand zu malen. Vielmehr möchte ich auf ein hier öfter diskutiertes aber leider noch immer sehr nebulöses Thema detaillierter eingehen: Das Phänomen der Zerstörung integrierter Schaltkreise durch den Effekt der Elektromigration.

Ich war überrascht als mir auffiel, wie schwierig es eigentlich ist, über dieses Thema mehr brauchbare und fundierte Informationen im Netz zu finden als die ständig verlinkten Wikipedia-Artikel zur Elektromigration selbst und vielleicht noch der Black'schen Gleichung. Nur wenige haben sich ernsthaft mit dem Thema auseinandergesetzt und fast alle Daten und Forschungen, die wirklich interessant wären für unsere Belange, gehören den großen Chipherstellern und unterliegen aus nachvollziehbaren Gründen der Geheimhaltung dieser Firmen. Die eine oder andere Quelle ist aber doch noch öffentlich zugänglich ohne dass ich die Landesbibliothek besuchen musste und eröffnet so manche Fakten, die den ein oder andren Übertakter vielleicht ins grübeln bringen werden… oder auch nicht. :haha:
Urteilt selbst!


Teil 1: Was ist Elektromigration eigentlich, woher kommt sie und was bewirkt sie?

Elektromigration ist laut Definition "der strominduzierte Massetransport innerhalb eines metallischen Leiters." Was für mich etwas schwammig klingt, da bei Stromfluss ohnehin immer, auch ohne Elektromigration, Masse transportiert wird – denn auch fließende Elektronen haben eine Masse auch wenn sie verdammt klein ist. Aber seis drum, gemeint ist hier, dass genau dieser Elektronenfluss unter bestimmten Umständen dazu in der Lage ist, Masse, also Atome des Leiters, "mitzureißen". Damit es dazu kommen kann braucht es grundsätzlich zwei Dinge: Eine Mindesttemperatur und eine vergleichsweise extrem hohe Stromdichte.

Wer sich noch dunkel an den ollen Physikunterricht erinnern kann könnte noch im Hinterkopf haben, dass Temperatur prinzipiell nichts andres ist als unwissenschaftlich ausgedrückt das Rumzappeln von Atomen – je heißer sie werden desto mehr zappeln sie rum (da ihre Energie zunimmt). Normalerweise tun sie das statistisch ungerichtet und chaotisch wenn man mal äußere Kräfte wie zum Beispiel die Schwerkraft außen vor lässt. Legt man aber einen starken Strom an, so würden auf etwa zappelnde Kupferatome in einer Leitung weitere Kräfte wirken, nämlich ein elektrisches Feld in die eine und eine durch fließende, kollidierende Elektronen entstehende (mechanische) Kraft in die andere Richtung, im Folgenden angelehnt an Quellen aus diesem Bereich "direkte Kraft" (elektrisch) und "Windkraft" (mechanisch) genannt.

Normalerweise sind diese Kräfte viel zu klein, als dass sie eine Bedeutung hätten, bei sehr hohen Stromdichten wird aber die (mit mehr Stromdichte viel schneller steigende) Windkraft durch fließende Elektronen so groß, dass die temperaturbedingte Bewegung der Kupferatome eine Richtungstendenz erhält, es springen also statistisch im Mittel mehr Atome in Richtung Elektronenfluss als dagegen. Dass die Atome wirklich aus ihren Gitterplätzen hüpfen können erfordert eine gewisse Sprungenergie, die leichter zusammenkommt, je wärmer die Atome sind und je höher die Stromdichte ist (Temperatur und Chipspannung begünstigen sich quasi dummerweise gegenseitig was den Verschleiß angeht). All das Beschriebene kann man wie so ziemlich alles in der Physik natürlich auch mathematisch beschreiben und berechnen, das will ich euch aber an der Stelle ersparen (wer sich da brutal reinhängen will siehe Literatur: „Electromigration: A review.“ Von P. G. Brusius (1997), ich würds aber nicht empfehlen :fresse:).

Kurz gesagt: Man braucht eine gewisse Temperatur dass die Atome genug Grundenergie haben und überhaupt springen können und man braucht einen ausreichend starken Stromfluss, um die Atome in eine bestimmte Richtung zu drücken – schon hauts den Leiter mit der Zeit aus den Latschen. Als Temperatur reichen da bereits Werte aus, die weit unterhalb angenehmer Arbeitsbedingungen für Menschen liegen und was die Stromdichten angeht über die wir hier reden ein kleines Beispiel: Würde in einer normalen Stromleitung im Haus (1,5 mm^2) die gleiche Stromdichte herrschen wie in einer aktuellen CPU (stellenweise zwischen 10^7 und 10^8 A/cm^2) so würden über eine Million Ampere fließen – und das Kabel in Sekundenbruchteilen verdampfen (jetzt wisst ihr, warum man bei so winzigen Strukturen wie denen in einer CPU Kühler draufpappt, die 100 W und mehr wegschaffen können… ;-))

Um sich eine Vorstellung machen zu können, wie Elektromigration in der Realität aussieht gibt’s noch ein Bildchen, auf dem ein Leiter, der unter absichtlicher starker Elektromigration leidet von einem REM abgelichtet wurde bis er schließlich nach 12 Stunden und 4 Minuten zerstört war (Quelle: „Elektromigration in Gold und Silber Nanostrukturen“, Doktorarbeit von Burkhardt Stahlmecke vom 15.01.2008, S 63):

EMig.jpg

Soviel zur Theorie hinter dem Phänomen. Was ist aber nun für uns Nerds an interessanten Informationen zu finden?


Teil 2: 7 Fakten für Nerds im Zusammenhang mit Elektromigration

1.) In heutzutage vielschichtig aufgebauten CPUs ist zumeist nur die unterste Schicht ernsthaft von Elektromigration gefährdet, da nur hier sehr hohe Spannungsdichten auftreten. Moderne CPUs enthalten viele Kilometer an Leiterbahnen (würde man sie aneinanderreihen) und viele Hundert Millionen Kontaktstellen – von diesen sind aber nur wenige Hundert auf der untersten Ebene des Chips durch Verschleiß bedroht – bei den restlichen Teilen der CPU ist die Stromdichte zu klein als dass Verschleiß eine bedeutende Rolle spielen würde. Dummerweise macht das für uns wenig Unterschied, denn eine kaputte Leitung reicht meist aus um die CPU zu zerstören – vor allem wenn sie an der Basis der CPU ist.

2.) Die Chiphersteller sind bereits (vermutlich bei den 90 nm und 65 nm Generationen) dazu übergegangen, entsprechend gefährdete Stellen nicht mehr rechtwinklig zu gestalten, sondern Leiter mit sehr hoher Stromdichte in ihren CPUs mehr oder weniger rund um Ecken zu führen wo es möglich ist, da an Ecken und scharfen Kanten Elektromigration durch den abrupten Richtungswechsel des Elektronenflusses noch stärker auftritt.

3.) Schäden durch Elektromigration sind, sofern die Leiterbahn noch nicht komplett zerstört wurde, bis zu einem gewissen Grad theoretisch "heilbar", indem man den Stromfluss umkehrt und abgetragenes Material sozusagen zurückfließen lässt. (Noch) nicht wirklich relavant für unsere Anwendung aber ich wollts mal erwähnen.

4.) Es existiert abhängig von der Stromdichte eine kritische Länge ("Blech-Länge", dabei ist Blech ein Eigenname und kein plattes Metallteil ;-)), unterhalb derer keine Elektromigration auftritt, da aufgrund des (werkstoffmechanischen) Spannungsgradienten im Gitter ein Rückfluss von Leerstellen auftritt, welcher den elektromigrationsgetriebenen Materialstrom kompensiert. Dummerweise ist das Phänomen bei heutigen CPUs aus baulichen Gründen wenig bis nicht anwendbar.

5.) Die angepeilte Lebensdauer für CPUs liegt in der Literatur meist übereinstimmend bei 10 Jahren für die maximale Arbeitstemperatur, meist angegeben mit 105°C. Letzteres deckt sich auch mit den Tjunction-Temperaturen von Intel, die Abschalttemperatur momentaner Sandys / Ivys liegt ebenfalls üblicherweise bei 105°C Kerntemperatur. Die Temperatur ist also im Gegensatz zur landläufigen Meinung NICHT das Hauptproblem für den Verschleiß von CPUs, eine CPU wird sowohl bei 30°C als auch bei 90°C unter Last länger halten als man sie benutzen will sofern die restlichen Parameter ebenfalls innerhalb der Spezifikation sind (so zu sehen an Laptop-CPUs, die viele Jahre vor sich hin glühen sozusagen ohne mit der Wimper zu zucken).

6.) In für normalsterbliche CPU-Nutzer üblichen Bedingungen steigt der Verschleiß durch Elektromigration einigermaßen linear mit der Temperatur und der Stromdichte, natürlich mit unterschiedlichen Steigungen sowie Wechselwirkungen der beiden Kenngrößen untereinander (da eine höhere Stromdichte im Sinne von mehr Spannung oder mehr Takt zumeist auch eine höhere Leistung und damit höhere Temperatur mit sich bringt wenn der Kühler nicht entsprechend angepasst wird). Ich war leider nicht in der Lage, genaue Zahlen aufzufinden da diese Dinge ganz offensichtlich streng geheim gehalten werden von unseren großen Chipherstellern, es ist aber anscheinend unumstritten, dass erhöhte Spannungen (die höhere Stromdichten erzeugen) wesentlich schädlicher sind als erhöhte Temperaturen. Nicht nur deshalb, weil der Verschleißeffekt dadurch schneller ansteigt, sondern auch deswegen, weil prinzipiell zu hohe Temperaturen im Sinne der maximalen Arbeitstemperatur laut Spezifikation gar nicht vorkommen können bei modernen CPUs (da sie dann schlicht abschalten), zu hohe Spannungen aber sehr wohl einstellbar sind. Da CPUs ab einer bestimmten Temperatur schlicht aus profaneren Gründen wie schmelzen von Material sofort zerstört werden wurde hier eine Notbremse eingebaut, für die Spannung, wo der Übergang zum Tode fließend ist und zusätzlich ein direkter Mehrwert im Sinne von mehr Takt erreichbar ist, wurde bisher davon abgesehen.

7.) Noch ein Wort zu Extrem-OC: Versuche bei extremen Kühlmethoden haben gezeigt, dass bei 77 K (LN2) keine Elektromigration auftritt, wo bei gleicher Stromdichte der Leiter bei Raumtemperatur (plus seiner Eigenerwärmung durch den Stromfluss) bereits nach 150 Sekunden ausfällt. Die Eigenenergie der Atome war offensichtlich hier zu gering, als dass sie in Summe mit der Windkraft ausgereicht hätte um die Sprungenergie aufzubringen, die zum Verlassen des Gitterplatzes nötig wäre (man verzeihe mir hier die formell inkorrekte Vermischung von Energie und Kraft aus Gründen der Anschaulichkeit). Dies erklärt, warum CPUs unter Extrembenchern Spannungen und damit Stromdichten ertragen können, die weit über dem sind, was sie bei üblichen Temperaturen überleben würden (selbst wenn die entstehende Abwärme abgeführt werden könnte). Das bedeutet nicht, dass der Effekt komplett veschwunden ist bei extrem niedrigen Temperaturen (supraleitende Effekte nahe 0 K ausgenommen, dann ist er tatsächlich ganz weg), bei weiter steigender Stromdichte werden auch CPUs unter LN2 irgendwann zerstört wenn die Windkraft eben ausreicht, um die Atome trotz geringer Temperatur aus dem Gitter zu hauen - was der ein oder andere Extrembencher vielleicht schon erlebt hat.


Ich hoffe, dass der Blog hier ein Wenig Licht ins Dunkel um das Thema Elektromigration gebracht hat (und ich wieder einen weiteren Link habe, den ich statt ständiger langer Erklärungsbeiträge bei dem Thema posten kann :ugly:). Hier auch wieder der obligatorische Glückwunsch an alle Interessierten, die sich durch den zugegebenermaßen trockenen Stoff bis hierher durchgekämpft haben, ich freue mich immer wenn’s auch nur ein paar wenige User sind, die sich meine Textergüsse antun wollen. :-)

Wenn jemand weitere Fragen zu dem Thema hat – am besten so lange der weitere Inhalt der Quellen, den ich hier aus Gründen der Verständlichkeit weitestgehend nicht eingebaut habe, noch irgendwo in meinem Schädel rumgeistert – möge er die Kommentarfunktion nutzen oder mir eine PN hinterlassen… bei der Gelegenheit nehme ich übrigens auch gerne Vorschläge für den "Jubiläumsblog" Nummer 20 an :-D
 
Dankesehr fuer diese Abendlektuere!
Elektromigration war mir zwar bereits vorher ein Begriff, die Tatsache, dass eine zu hohe Spannung weitaus gefährlicher fuer CPUs (bzw allgemein Halbleiter) ist, ueberrascht mich jedoch.

Jetzt habe ich wohl eine Beschaeftigung gefunden, ich klicke mich mal durch deine anderen Beitraege :)
 
hoffe es kommen öfter solche blogs liest sich wirklich gut und verständlicher als mein lehrer sowas erklären könnte
 
Danke fürs Kompliment... den Lehrerberuf habe ich damals aber bewusst nicht ergriffen... so stahlharte Nerven hab ich dann doch nicht :haha:
 
Ich finde die langen Blogeinträge schön. Sie sind gut zu lesen und haben bis jetzt immer interessante Themen behandelt. Bitte nicht aufhören, ich "kämpfe" mich gerne durch :D :daumen:
 
Danke fürs Update ! wer nicht ganz unbelesen ist versteht auch den kompletten Blog ohne lehrbuch daneben =)
 
Alki! der Blog-Eintrag is zu kurz! ich hab noch 35min Informatik! willst du mich mit dem Autorensystem aka Multimedia ToolBook oder sowas umbringen?! Ich brauch Ablenkung!

Ansonsten super erklärt. Das von dir oft beschriebene Durchkämpfen find ich sehr entspannend und hilfreich ;)
 
Wow... so viel Lob auf einmal, danke euch allen! :)

@Placebo: Wenn du noch Themen hast die interessant für euch/das Forum wären nehme ich wie erwähnt gerne Anregungen an ;-)

@drebbin: Das war der Plan... :-D

@991jo: Ich glaube wenn ich mit nem Blog ne ganze Schulstunde oder gar Vorlesung überbrücken würde wäre es endgültig ausgeufert :haha:
 
In übrigen hier zum Copy and Past das Hoch 2 --> mm² ;)
Dein Blog mausert sich hier ja richtig zu einer kompletten Serie, Respekt. :daumen: Zum Thema selbst, einfach und verständlich erklärt.
 
alex2210;bt5046 schrieb:
Klingt alles sehr einleuchtend, Studierst du Physik oder eine andere Naturwissenschaft ?

Ich bin Ingenieur für Maschinenbau und Prozesstechnik, habe also im weiteren Sinne mal was naturwissenschaftliches studiert, ja.
Das Studium hat aber mit den Blogs hier inhaltlich wenig zu tun, DIE Thematik ist einfach nur ein Hobby von mir... die Ausbildung hilft nur ein wenig dabei, die ganzen zu Grunde liegenden zumeist wissenschaftlichen Quellen besser zu verstehen... die (Haupt-)Quelle zu dem Blog hier war wie auch angegeben ne Physik-Doktorarbeit. ;)
 
Nein, möchte ich nicht. Bei Wikipedia werden solche Einträge oft innerhalb kürzester Zeit wieder gelöscht (trotz Quellenangaben) und im Extremfall wieder durch vorher vermerkte falsche Aussagen ersetzt. Ich habe keine Zeit und keine Lust mich mit denen da zu streiten. Die Erfahrung habe ich (und einige meiner ehemaligen Profs) leider machen müssen. :(

Das soll nicht heißen dass Wiki schlecht ist (im Gegenteil), aber einige Personen dort verteidigen ihre offensichtlich stellenweise falschen Artikel leider bis aufs Messer.
 
Ich finde es immer wieder erfrischend, dass es Menschen gibt die sich auch mit solch wichtigen Themen auseinandersetzen.Warum das scheinbar ein Randthema zu sein scheint verstehe ich auch nicht. Sehr informativ und verständlich geschrieben .
Vielen Dank dafür .
MfG . wolflux
 
Naja, "wichtig" ists ja an sich für die breite Masse nicht deswegen ists auchn Randthema. Intressieren musses ja nur die Chipentwickler selbst und uns paar nerds die die hardware an die Grenzen treiben. Die restlichen 99,9% der Menschen da draußen werden wohl nie ein Problem mit Emig haben. :haha:

Aber vielen Dank fürs Lob! :-)
 
Sehr lehrreicher Artikel!
Kann man konkrete Spannungsbereiche sagen, die einen Halbleiter (oder Chip) ca.5 Jahre leben lassen oder hilft da nur probieren? :ugly:
Gibt es Chips die mehr Spannung vertragen als andere?
 
Zurück