Geforce RTX 4000 gegen Radeon RX 7000: Nvidia mit Vorteil in der Fertigung?

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu Geforce RTX 4000 gegen Radeon RX 7000: Nvidia mit Vorteil in der Fertigung?

Nvidia soll einen leichten Vorteil in der Fertigung der kommenden Grafikkartengeneration haben. Die Geforce RTX 4000 komme demnach im TSMC 4N, während AMD bei 5 und 6 nm steht.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Thread zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

Zurück zum Artikel: Geforce RTX 4000 gegen Radeon RX 7000: Nvidia mit Vorteil in der Fertigung?
 
Bitte nicht "4N" mit "N4" verwechseln!!

Ein vorstehendes "N" ist der Node von TSMC, beispielsweise der 5nm Prozess heißt "N5".
Ein nachstehendes "N" ist ein Suffix das in dem Falle für "Nvidia (-optimiert)" steht - und auch hier ist der Name beliebig wählbar. Ein "4N" kann also auch ganz einfach ein "N5"-Prozess sein den man für NVidia angepasst und marketingwirksam benannt hat.
 
Neuere Technik bedeutet bei TSMC aber auch höhere Unkosten.
Solange AMD noch ordentliche Effizienzwerte liefert und die Preise dafür in machbaren Ergionen bleiben, sollte das egal sein.
Gab es nicht mal eine News, dass NVidia sich vorab richtig teuer eingekauft hat?
Muss natürlich vom Kunden abgezahlt werden.
 
Vor allem wird die Karte gekauft, die keinen extremen Stromverbrauch hat. Da kann die Effizienz noch so toll sein, wenn der Verbrauch zu hoch ist, ist es völlig egal ob sie im Verhältnis weniger verbraucht, denn sie verbraucht dann trotzdem mehr. Und wenn da von beiden nichts anständiges kommt und beide (Nvidia und AMD) nur auf Leistung ohne Rücksicht auf Verluste machen dann werde ich mich für eine rx6800, rx 6800XT, einer der zukünftigen 50er Varianten oder eine Intel entscheiden. Nvidia (obwohl ich fast immer Nvidia hatte), hat bei mir aufgrund zu hoher Preise und zu wenig Speicher auf der GraKa (da beeindrucken mich die FPS pushenden Technologien wenig, denn bei zu wenig Speicher ist dann im Extremfall trotzdem Schluss) ausgediehnt. Bin noch relativ glücklich mit meiner 1070er bis Herbst/Winter und werde mir dann einen sehr anständigen PC zusammenbauen, oder zusammenbauen lassen. Da soll dann eine anständige Karte rein und zwar keine die mit Kunden Spielchen macht.
 
Ich erwarte eigentlich von Wechsel von Samsung zu TSMC einen Riesen Sprung.
Ich glaub das die Herstellung genauso an AMD angepasst wird. Mich würde es nicht wundern das die dann bei der Vorstellung mit 3AMD kommen.
 
Vor allem wird die Karte gekauft, die keinen extremen Stromverbrauch hat. Da kann die Effizienz noch so toll sein, wenn der Verbrauch zu hoch ist, ist es völlig egal ob sie im Verhältnis weniger verbraucht, denn sie verbraucht dann trotzdem mehr. Und wenn da von beiden nichts anständiges kommt und beide (Nvidia und AMD) nur auf Leistung ohne Rücksicht auf Verluste machen dann werde ich mich für eine rx6800, rx 6800XT, einer der zukünftigen 50er Varianten oder eine Intel entscheiden. Nvidia (obwohl ich fast immer Nvidia hatte), hat bei mir aufgrund zu hoher Preise und zu wenig Speicher auf der GraKa (da beeindrucken mich die FPS pushenden Technologien wenig, denn bei zu wenig Speicher ist dann im Extremfall trotzdem Schluss) ausgediehnt. Bin noch relativ glücklich mit meiner 1070er bis Herbst/Winter und werde mir dann einen sehr anständigen PC zusammenbauen, oder zusammenbauen lassen. Da soll dann eine anständige Karte rein und zwar keine die mit Kunden Spielchen macht.

Wenn du so ein Effizienzfetischist bist, dann untertakte und untervolte die Karte doch einfach. Damit läßt sich jeder Stromschlucker in ein Effizienzwunder, das es so nicht zu kaufen gibt, verwandeln.
 
Wenn du so ein Effizienzfetischist bist, dann untertakte und untervolte die Karte doch einfach. Damit läßt sich jeder Stromschlucker in ein Effizienzwunder, das es so nicht zu kaufen gibt, verwandeln.
Lies bitte meinen Text nochmal genau durch, ich bin eben KEIN " Effizienzfetischist", ich gehe nur auf den hier von uns kommentierten Text ein und sage, dass die hier gepriesen Effizienz pseudo ist, bzw. einem nichts nützt in punkto hohem Stromverbrauch. Außerdem verstehe ich nicht so ganz wieso ich eine teure Karte undervolten sollte, wenn ich für weniger Geld eine Karte bekomme die das Gleiche kann und an der ich nichts " verstellen" muss.
 
Effizienz kann man man entweder nicht bezahlen oder nicht kaufen und daher freue ich mich lieber auf mehr Bildqualität und mehr FPS. :daumen:
 
Lies bitte meinen Text nochmal genau durch, ich bin eben KEIN " Effizienzfetischist", ich gehe nur auf den hier von uns kommentierten Text ein und sage, dass die hier gepriesen Effizienz pseudo ist, bzw. einem nichts nützt in punkto hohem Stromverbrauch. Außerdem verstehe ich nicht so ganz wieso ich eine teure Karte undervolten sollte, wenn ich für weniger Geld eine Karte bekomme die das Gleiche kann und an der ich nichts " verstellen" muss.

Die Karte kann man auch untertakten und untervolten und damit spart man noch mehr.

Wer heute an Effizienz oder genauer gesagt an einem geringen Stromverbrauch interessiert ist, der kommt da eigentlich nicht dran vorbei. Es wäre schön, wenn AMD und Nvidia verschiedene Profile anbieten würden, die man dann im Treiber aktiviert.

Effizient werden die neuen Karten ja sein. 210% Leistung, bei schlimmstenfalls 170% Leistungsaufnahme, das ist effizienter.

EDIT: wenn man eine Karte untervoltet, ohne den Takt zu begrenzen, dann wird sie schneller, Turbo sei Dank.
 
Zuletzt bearbeitet:
Neuere Technik bedeutet bei TSMC aber auch höhere Unkosten.
Solange AMD noch ordentliche Effizienzwerte liefert und die Preise dafür in machbaren Ergionen bleiben, sollte das egal sein.
Gab es nicht mal eine News, dass NVidia sich vorab richtig teuer eingekauft hat?
Muss natürlich vom Kunden abgezahlt werden.

Nvidia hat sich Kontingente gesichert, so wie alle anderen Hersteller auch. "Richtig teuer" ist das für alle, ich denke nicht dass Nvidia mehr pro Wafer zahlt als die Konkurrenz bei den Absatzmengen.

Lies bitte meinen Text nochmal genau durch, ich bin eben KEIN " Effizienzfetischist", ich gehe nur auf den hier von uns kommentierten Text ein und sage, dass die hier gepriesen Effizienz pseudo ist, bzw. einem nichts nützt in punkto hohem Stromverbrauch. Außerdem verstehe ich nicht so ganz wieso ich eine teure Karte undervolten sollte, wenn ich für weniger Geld eine Karte bekomme die das Gleiche kann und an der ich nichts " verstellen" muss.

Du solltest vielleicht mal überdenken was "effizienter" heißt. Wie @Pu244 sagte, wenn die neue Karte 2x so viele FPS liefert (bei gleichen Einstellungen natürlich), dabei aber nur 1,5x so viel Strom verbraucht, dann ist sie deutlich effizienter auch wenn der Stromverbrauch insgesamt gestiegen ist.

Eine teure Karte liefert undervoltet in der Regel immer noch mehr Leistung als die nächst-kleinere Karte die man mit Werkseinstellungen laufen lässt. Meine 3080 als Beispiel zieht nie mehr als 280W (in Benchmarks wohlgemerkt) und verliert nur ca. 5-10 FPS im Vergleich zu den Werkseinstellungen die dann 350W ziehen.
 
" ... der Custom-Prozess soll dabei unter anderem den Vorteil bieten, dass hiermit gefertigte Chips auch Betriebstemperaturen von 120°C verkraften, während eine Leistungsaufnahme von über 450W (Chip) respektive 600W (Karte) vorliegt. Eine (Shader-)Kernschmelze wird so effektiv verhindert."

Spaß beiseite, letztlich kann man nur abwarten, was die Auswirkungen sein werden. Ein Marketingvorteil ergibt sich wohl definitiv. Wenn es sich um einen Custom-5nm-Prozess handelt, hätte man ihn konsequenterweise auch "5N" nennen können, statt auf "4N" zurückzugreifen. Aber letztlich sind Namen Schall und Rauch. Möge die kommende Grafikkartengeneration mit genügen Speicher bestückt sein - darum muss man sich nach Stand der Gerüchte ja noch die größten Sorgen machen.
 
Was nützt eine bessere Fertigung wenn nvidia die wärmedichte erhöht
606mm² vs 628mm³ bei 144sm vs 120sm
ja ampere hat ein drittel des chips deaktiviert
ad102 12gpc ga102 10gpc
ein SM 12alu
ad102 nur chip 450w
ga102 nur chip 315w 84sm aktiv von 120sm 628/120=5,23mm² pro sm
ad102 nur chip 450w 136sm aktiv von 144sm 606/136=4,45mm² pro sm
oder 17,5% denser
Aber Weil mehr sm aktiv sind zieht das ordentlich
450/136=3,3w pro sm
315/84=3,756w pro sm aber mehr Fläche 628/84=7,47mm²
also hat man doppelte wärmedichte
Das zieht sich durch alle skus
daher gehe ich davon aus das alle skus deutlich weniger sm aktiv haben und dafür höher Takten
Was auch die hohen Stromverbräuche erklärt.
 
ja ampere hat ein drittel des chips deaktiviert
ga102 nur chip 315w 84sm aktiv von 120sm
Erstmal ist Ampere eine Architektur und kein Chip.
GA102 hat im Vollausbau 84 SM.
128 SM sind es bei GA100. Das ist ein ganz anderer Chip, 826 mm² gefertigt in TSMC N7.

Davon ab, seit wie vielen Jahren (Jahrzehnten?) sehen wir steigende Transistormengen bei relativ konstanten Chipgrößen. Das ist genau der Nodeshrink welcher uns vorantreibt (in Kombination mit Effizienzsteigerungen).
Eine immer weiter steigende absolute Leistungsaufnahme killt allerdings.
 
Zuletzt bearbeitet:
Udn wie bite sol man ungerade sm auf dem chip realisieren
Es sind 2 reihen zu je 5 gpc=10
Ga100 144sm aktiv 128
ga102 120sm 84 aktiv
ga103 96sm 48 akriv
ga104 72sm derzeit 46 aktiv (nur notebooks)
ga106 48sm 28 aktiv
ga104 24sm 20 aktiv
Hier markt man einfach das smsung yield extrem schlecht sind und erst ein 150m² chip so gerde mal die beste ausbeute hat
30 und 84sm gehen technisch nicht
Mir ist nicht bekannt das man chips mittlerweile Asymmetrisch schneiden kann
Siehe so das bild aus dem whitepaper ga102
1651003036261.png

ein sm
1651003096356.png

Es ist aber unlogisch wo sind die fp64 wovon nur 24 aktive sind?

so ein reales Bild
1651003432691.png


ist was verwirrend
Links rechts lila SI
Unten L3 und rop

Mitte an

Grün/ocker fp32 und int32
Dunkelgeld tpc=tmu
rechts Grau neben dem fp32+int32 ist deaktiviert
Hier klärt sich das auf in a100 Dokument
1651004649043.png



Man merkt das der chip ursprünglich für 7nm designt wurde

Das ergibt dann 32fp64 und 64fp32 =96fp32 wäre da nicht das nvidia hier 8 fp64 deaktiviert hat. Womit wir bei 88 fp32 Operationen sind pro SM.
Lovelace könnte das beibehalten und darauf beruhe die Berechnungen meinerseits ältere noch mit 96 fp32
Da mir das mit den deaktivierten fp64 erst kürzlich aufgefallen ist
Hier erklären sich auch meine Testergebnisse wo ich nur 74% schneller war als meine alte gpu
gtx1060 etwa 4,9tf
rtx3060 8,53tf aufgrund vom cpu limit Maximum ist 8,9tf (82% schneller als die gtx1060 wenn kein cpu limit)
 
Zuletzt bearbeitet:
Bitte nicht "4N" mit "N4" verwechseln!!

Ein vorstehendes "N" ist der Node von TSMC, beispielsweise der 5nm Prozess heißt "N5".
Ein nachstehendes "N" ist ein Suffix das in dem Falle für "Nvidia (-optimiert)" steht - und auch hier ist der Name beliebig wählbar. Ein "4N" kann also auch ganz einfach ein "N5"-Prozess sein den man für NVidia angepasst und marketingwirksam benannt hat.
Ich wäre sowieso für eine einheitliche Norm der Bezeichnungen. Also der ganzen Fertigungsgrößen.
Das auch die reellen Größen immer angegeben werden.
Sonst blickt da noch kaum noch jemand durch.
 
Zurück