Also in etwa so, wie die ganzen letzten Jahre...?

Wie viel ist ein 11900K oder 5950X rein auf die IPC gesehen nochmal schneller als ein Skylake von 2015? 30% oder sowas?
Könnte hinkommen, aber nur wenn du die gewachsenen Caches und Speichertakt mit berücksichtigst. Reine IPC RKL gegenüber CML, der sich im Kern praktisch nicht von SKL unterscheidet, gibt sogar Intel selbst mit 20 Prozent an, in der Spiele-Praxis kann überschlagen eher mit 10 Prozent rechnen. Bei Zen 3 sieht es in Anwendungen natürlich spürbar besser aus, in Spielen herrscht bekanntermaßen eher pro-Kern-und-Takt-Gleichstand.
Wenn du klassisch viele kerne willst brauchste viel Diespace bzw. große Einzelchips.
Wenn du stapelst kannst du beispielsweise nur 1/4 so große Einzelchips herstellen und 4 davon stapeln.
Das klingt gleich, letzteres ist aber weit weniger Yieldrateanfällig - denn wenn du einen Siliziumfehler im großen Chip hast ist der CHip für die Tonne, im zweiten Beispiel wäre einer für die Tonne und die anderen drei brauchbar. Wenn das Stacking massenware ist und nicht für sich gesehen einen großen Kostenfaktor ausmacht dann wird ein 4x8 gestackter 32-Kerner schlicht billiger als ein 32-Kern-Monoolithischer Die.
Stacking von Leistungskomponenten verbraucht zusätzliche Fläche in den unteren Lagen für die Stromversorgung, auch bei Komponenten mit hohem Transferratenbedarf zum restlichen System sind die TSVs nicht ohne. Dazu hat das Stacking als solches, also die extrem Verdünnung der Wafer, ihre Platzierung übereinander und die Verbindung seinerseits eine Ausfallquote, sodass vier funktionierende Kerne übereinander immer die Belichtung von mehr Silizium erfordern werden, als vier funktionierende Kerne nebeneinander – wobei letztere auch nicht zwingend auf dem gleichen Chip liegen müssen. Bei leistungsfähigen CPUs stellt sich die Frage nach Kern-Stacking aber auch gar nicht. Die eigentlichen Recheneinheiten machen weniger als 1/3 der Siliziumfläche aus, allein der L3-Cache nimmt oft über 50 Prozent des Chips ein.
Ryzen-(Threadripper-)3000-Die-Shots lassen zahlreiche Details auf dem Prozessor-Silizium erkennen. Aber welche eigentlich? Wir haben genau hingeschaut.
www.pcgameshardware.de
Intel hat schon vor 1,5 Jahrzehnten Demo-Prozessoren mit Cache-on-Top vorgeführt, das ist erstmal der naheliegende Schritt. Gestapelte Logik werden wir erst sehen, wenn die Kommunikation zwischen Kernen über die schmalen Kanten nicht mehr schnell genug erfolgen kann und man stattdessen den flächigen Kontakt eines Stack sucht. Aufgrund der riesigen Probleme mit Kühlung und Stromversorgung könnte dieser Punkt aber nie erreicht werden; Intel strebt ja mit PowerVia sogar in die Gegenrichtung und will weniger Krempel auf die Kerne packen, damit das Routing beherrschbar bleibt. Ggf. wird stacking für CPUs mit der Technik sogar ganz obsolet, denn der Schritt von Nano-PowerTSVs zu Nano-DataTSVs, mit denen Cache oder ander Strukturen auf die Rückseite des gleichen Wafers belichtet werden können, erscheint mir ein kleiner zu sein.