Nvidia Blackwell: Nachfolger von Lovelace und Hopper durchgesickert?

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu Nvidia Blackwell: Nachfolger von Lovelace und Hopper durchgesickert?

Mit Blackwell ist der mögliche Nachfolger von Hopper und Lovelace durchgesickert - wobei im Moment noch unklar ist, ob der Codename eine der beiden oder beide für dieses Jahr geplanten Veröffentlichungen beerbt.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Thread zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

Zurück zum Artikel: Nvidia Blackwell: Nachfolger von Lovelace und Hopper durchgesickert?
 
Da ada ist der vorname von lovelace
Zu blackwell nun bin malö gespannt was nidia da fün design wählt.
Da aber gerüchte von schlechten 3nm yield ausgehen würde ich eher sagen das nvidia lovelace auf 4nm nochmal nen takt mehr spendiert und die 2,5ghz anpeilt
bsp ad106 bekanntlich 5gpc (60sm je 96alu) ergeben das 32tf +11% vs vorgänger
Sprich nvidia wird aus dem kommenden rtx4070 danach als rtx560 bringen
4nm node derzeit 12000$ (möglich), 5nm 16500$ 6nm bei 10000$
line upd als rtx50 serie dann
ad110 rtx 5090 +15% Takt 136sm= +15% vs rtx4090
ad114 rtx5080 +15% takt =110sm +30%
ad114 rtx5070 +15Takt = 100sm +42%
ad116 rtx5060ti +15%takt = 60sm +78% vs rtx4060ti und für mich interessant vs ampere ga 106 rtx3060 =+200% mögliche uvp 459€
ad117 rtx 5050 8gb 128bit si +15% Takt =36sm +67% vs rtx 4050 mögliche uvp 259€ bei 17,2tf
ad120b rt5030 2sm 96bit si +15% Takt= +13% vs rtx4050 vs ampere ga107 rtx3050 +53%
rtx 5050 6gb für 179€ mit 10tf was etwa dann der rtx3060 entspricht
so sieht es aus 2025

Schwierig aber die rtx 5050 wäre als einzige option denkbar für meine kommende cpu r7 5800x3d ipc um die 310
1440p wird wohl Pflicht wenn es den der ad116 wird mit 28,8tf
das entspricht der heutigen rtx3090 mit 12gb vram

mcm wird kommen die Bedingung ist aber 3nm den in 5nm bzw 4nm sind die chips noch zu groß es sollen auf eine substrat 4 chips kommen mit je 60sm
dann wäre das bga etwa 2500mm² groß
Da werden langsam die Signalwege zu lang in 3nm wäre das nur 1087mm²(30% kleiner als 5nm)
Das ist zwar nah an der grenze geht aber noch das maxed derzeit sind 826mm² (gv100) was man als monolithischen die mit bga konstruiert hatte.
In mcm könnte man die signal wege an den rendern und dazwischen legen zwischen den chips sind maxed 1mm abstand am rand dann 4mm auf dem substrat
Spannend wird nur ob nvidia ähnliches wie amd mit dem brückenchip löst oder in nen aktiven substrat sprich aktiven interposer arbeitet
bedeutet aber auch das min ein wafer für den brücken chip bzw activen interposer auf 1100mm² belichtet werden kann.
Dahe muss nvidia irgendein art brüclkenchip auf den chips setzen der kleiner ist und das max dann Belichtung kann sprich 900mm² den ohne wird das nix mit mcm
oder 3nm wird voll ausgereizt (60% kleiner) dann geht es. dann misst das mcm nur noch 727mm² mit 240sm und etwa 2,5ghz nach derzeitiger architektur wären das
115tf
ich erwarte aber mit der neuen architektur neue sm strukturen
ich gehe fasst davon aus das man 64 fp32 und 64 fp64 +32 int32 +32 tensor cores und ein rt core wird
Dafür opfert man etwa 15% an wafer fläche aus mögliche 88mm² wird dann 101mm² 625mm² und das substrat mit 750mm²
formel dann 128*240*2,5*2=153tf
Das aber wird definiti nicht am desktop kommen.
Die nächstes gen ist schon arg am limit bei 1080p kaum eine cpu dies auslasten kann
lovelaced 136sm 2,2ghz =57tf und das wird bestensfalls noch amd r7 6950x schaffen mit einer ipc von 330 auf 4k gerade mal auslastbar.
darum wird es den ad102 nicht am desktop geben und stattdessen nur den ad104 mit nur 96sm 40tf oder ad102 mit 112sm mit 47tf
Sprich rtx3090 s rtx4090 +42% oder +67%
Das aber hängt davon ab ob amd mcm am desktop bringt
 
Da ada ist der vorname von lovelace
Zu blackwell nun bin malö gespannt was nidia da fün design wählt.
Da aber gerüchte von schlechten 3nm yield ausgehen würde ich eher sagen das nvidia lovelace auf 4nm nochmal nen takt mehr spendiert und die 2,5ghz anpeilt
bsp ad106 bekanntlich 5gpc (60sm je 96alu) ergeben das 32tf +11% vs vorgänger
Sprich nvidia wird aus dem kommenden rtx4070 danach als rtx560 bringen
4nm node derzeit 12000$ (möglich), 5nm 16500$ 6nm bei 10000$
line upd als rtx50 serie dann
ad110 rtx 5090 +15% Takt 136sm= +15% vs rtx4090
ad114 rtx5080 +15% takt =110sm +30%
ad114 rtx5070 +15Takt = 100sm +42%
ad116 rtx5060ti +15%takt = 60sm +78% vs rtx4060ti und für mich interessant vs ampere ga 106 rtx3060 =+200% mögliche uvp 459€
ad117 rtx 5050 8gb 128bit si +15% Takt =36sm +67% vs rtx 4050 mögliche uvp 259€ bei 17,2tf
ad120b rt5030 2sm 96bit si +15% Takt= +13% vs rtx4050 vs ampere ga107 rtx3050 +53%
rtx 5050 6gb für 179€ mit 10tf was etwa dann der rtx3060 entspricht
so sieht es aus 2025

Schwierig aber die rtx 5050 wäre als einzige option denkbar für meine kommende cpu r7 5800x3d ipc um die 310
1440p wird wohl Pflicht wenn es den der ad116 wird mit 28,8tf
das entspricht der heutigen rtx3090 mit 12gb vram

mcm wird kommen die Bedingung ist aber 3nm den in 5nm bzw 4nm sind die chips noch zu groß es sollen auf eine substrat 4 chips kommen mit je 60sm
dann wäre das bga etwa 2500mm² groß
Da werden langsam die Signalwege zu lang in 3nm wäre das nur 1087mm²(30% kleiner als 5nm)
Das ist zwar nah an der grenze geht aber noch das maxed derzeit sind 826mm² (gv100) was man als monolithischen die mit bga konstruiert hatte.
In mcm könnte man die signal wege an den rendern und dazwischen legen zwischen den chips sind maxed 1mm abstand am rand dann 4mm auf dem substrat
Spannend wird nur ob nvidia ähnliches wie amd mit dem brückenchip löst oder in nen aktiven substrat sprich aktiven interposer arbeitet
bedeutet aber auch das min ein wafer für den brücken chip bzw activen interposer auf 1100mm² belichtet werden kann.
Dahe muss nvidia irgendein art brüclkenchip auf den chips setzen der kleiner ist und das max dann Belichtung kann sprich 900mm² den ohne wird das nix mit mcm
oder 3nm wird voll ausgereizt (60% kleiner) dann geht es. dann misst das mcm nur noch 727mm² mit 240sm und etwa 2,5ghz nach derzeitiger architektur wären das
115tf
ich erwarte aber mit der neuen architektur neue sm strukturen
ich gehe fasst davon aus das man 64 fp32 und 64 fp64 +32 int32 +32 tensor cores und ein rt core wird
Dafür opfert man etwa 15% an wafer fläche aus mögliche 88mm² wird dann 101mm² 625mm² und das substrat mit 750mm²
formel dann 128*240*2,5*2=153tf
Das aber wird definiti nicht am desktop kommen.
Die nächstes gen ist schon arg am limit bei 1080p kaum eine cpu dies auslasten kann
lovelaced 136sm 2,2ghz =57tf und das wird bestensfalls noch amd r7 6950x schaffen mit einer ipc von 330 auf 4k gerade mal auslastbar.
darum wird es den ad102 nicht am desktop geben und stattdessen nur den ad104 mit nur 96sm 40tf oder ad102 mit 112sm mit 47tf
Sprich rtx3090 s rtx4090 +42% oder +67%
Das aber hängt davon ab ob amd mcm am desktop bringt
Was laberst du da eigentlich schon wieder für ein Mist zusammen
Die nächsten gen wird genauso im gpu Limit hängen in 4k wie jetzt eben auch und mit garantierter Sicherheit wird auch kein Zen 4 dafür benötigt was du dir da wieder an den Haaren herbeiziehst is schon echt wieder unglaublich...
Genauso unlogisch das es den ad 102 nicht im desktop geben wird ????

Wenn du mal echte Fakten hast kannst wieder weitermachen

Mal davon abgesehen das deine angeblichen Rechnungen immer dermaßen daneben liegen....
 
Auch interessant :fresse:

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Twitter. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
Vorallem spannedn welche absurden Preise wieder mal aufgerufen werden.Dann werden wir nen neuen Stromverbrauch sehen um mehr Leistung zu erreichen. Naja heutzutage kann man wohl vergessen bei gleichen Stromverbrauch mehr Leistung zu bekommen.Man wird ja wohl noch träumen dürfen.
 
nicht realistisch
Nun mein zen 2 211 cb15 rtx3060 gpu load von 47 games gpu intensiv 92% 1080p
rtx3090 doppelt so schnell 2160p braucht 75% mehr Leistung im schlimmsten Fall
zen 3 cb15 270 = +28%
Rtx 3060ti etwa 30% mehr leistung in 1080p mit zen 3 optimal
rtx 3070 50% schneller als rtx3060 cp ulimit auf 1080p in 1440p etwa 33% mehr leistung benötigt ideal
rtx3080 91% mehr leistung erst auf 4k ausgelastet möglich biss zu 80% gpu load
rtx3090 102% mehr Leistung gpu load bei etwa 70%
Das sind diese spiele Ohne msaa

Spiele aus den Jahren 2016-2021 rtx 3060
GPU load %​
Rise of the tomb raider
96,00 %​
Deus ex mankind divided
96,00 %​
Dying light -the following
92,00 %​
Watch dogs 2
98,00 %​
Tes skyrim HD se
95,00 %​
Doom 2016
66,00 %​
Shadow warrior 2
76,00 %​
hitman
97,00 %​
Mafia 3
97,00 %​
Wolfenstein 2 the new collossos
93,00 %​
Resident evil 7
99,00 %​
Dirt 4
98,00 %​
Prey 2017
66,00 %​
Mittelerde Mordors Schatten
96,00 %​
Hellblade sanua’s sacrifice
98,00 %​
Warhammer dawn of war 3
90,00 %​
Dishonord death of the outsider
71,00 %​
Sniper elite 4
97,00 %​
TC g r wildlands
97,00 %​
Sniper ghost warrior 3
94,00 %​
Forza horizon 4
97,00 %​
Shadow of the tomb raider
98,00 %​
F1 2018
99,00 %​
Far cry 5
87,00 %​
Kingdom come Deliverance
89,00 %​
Red Faction: Guerrilla Re-Mars-tered (Remaster)
75,00 %​
Anno 1800
94,00 %​
F1 2019
97,00 %​
Metro exodus
97,00 %​
Control
97,00 %​
Far cry new dawn
83,00 %​
Rage 2
97,00 %​
Wolfenstein youngblood
96,00 %​
Tc ghost recon breakpoint
96,00 %​
Mittelerde shadow of war
100,00 %​
Just cause 4
96,00 %​
Borderlands 3
96,00 %​
Dirt rally 2
98,00 %​
Cyberpunk 2077
98,00 %​
SE Ghost warrior contracts
99,00 %​
Doom eternal
99,00 %​
Gears tactics
96,00 %​
Immortals fenix rising
95,00 %​
Dirt 5
99,00 %​
Watch dogs legion
99,00 %​
Days gone
99,00 %​
93,22 %​
Ergo
93% gpu load​

In dxr mögliche 100% gpu load
heftigste dxr spiele in 1080p

metro exodus ee avg fps rtx3060 etwa 30 ohne dlss (extreme settings)
control avg fps rtx 3060 60 ohne dlss
cyberpunk 2077 avg fps rtx3060 35 ohne dlss (psycho settings)
dying light 2 avg fps rtx3060 45 ohne dlss
minecraft rtx etwa 30fps
watch dogs legion etwa 40fps

ja ich weiß das paar spiele in cpu limit kommen wegen fps cap (bsp doom)
neu würde ich noch dying light 2 (99% gpu load) und farcry 6 dazu setzen was auch mit dxr maximal 85% gpu load hat auf 1080p ohne fsr
Das aber hängt stark vom Treiber ab derzeitiger 500gen ist noch bis zu 85% load gab auch Revesionen wo dieser nur bis 65% gpu load kam.
Und ja cpu limit lässt sich schwerlich mit gpu load % abgleichen im groben sollte das aber passen
Den je mehr das OS auf mehr kerne ausweichen kann desto mehr ipc eines kern wird frei folglich steigen die fps an und somit die Auslastung der gpu.
Das ist spiel engine abhängig
Zudem ist der Maßstab wieviel tf man braucht auch von der bandbreite abhängig
Und jedes spiel sofern tripple aaa wird auf konsolen hin designet
Specs der
ps4 190gb/s etwa 1,8tf
ps4 pro 230gb/s 4,0tf
ps5 576gb/s 10,5tf
ps6 vermutlich 2025 28-32tf 912gb/s 256bit si mit 32gbits gddr7 +256mb inf cache

Daran werden spiele hin designet derzeit reicht aber der standard von ps4 pro aus.
PS5 wird in naher Zukunft das minimum sein, maßgeblich für dxr auf level der rtx2060 bzw rx6700xt
was dann etwa 500gb/s wären mit 10tf mit nah meine ich 2023 wo die ersten spiele auf dxr basis kommen. Im übrigen 30fps ziel bei 1440p
Darum ist meine Behauptung ab 2025 mit in der Mittelklasse 29tf exakt der punkt für 1440p wo aktuell die rtx3090 im cpu limit lauert.
Und die cpu ipc gains sind bei zen 4 nur 25% von zen3 aus sprich 330
das ist zugegeben weniger als gedacht aber durchaus glaubhaft ich sehe da maximal eine Auslastung von 40tf was exakt die rtx4090 mit dem ad104 (neue info ad103 10gpc=100sm 96 aktiv) passt
Der ad102 mit 136sm wird definitiv bei 2,2ghz und 57tf nicht am desktop kommen. zu teuer.~412$-660$
endkunden preise 1699€ oder 2299€
Und eine sku mit nur 120sm dann 1399-1699€
jeweils 16gb gd7 32gbits
Im übrigen verhungern diese chips am SI ab 50tf wirds eng mit 384bit und nur 1536gb/s
ad103 vermute ich 320bit mit 32gbits=1280gb/s
Das könnte reichen
oder nvidia nutzt HBM2e mit 3,2ghz=3278gb/s an 4096bit für 57tf
ich behaupte mal frech das nvidia die architeur des Sm ändert auf 128 fp32
sprich 64fp32 und 64 fp64
Derzeit 64 fp32 und 32 fp64 (können 2 operationen in einen Takt)=96 fp32 von 128 shader von nvidia marketing was real aber 64 fp32 und 64 int32 sind.
Die int32 können kein floating point mehr.
nachzulesen in dem Whitepaper ampere von 2020
1646166059422.png

1646167042275.png


Mögliche Änderung nochmal 32 fp64 dazu oder nochmal 16 fp32
Entweder 128 shader oder 112 pro sm in 02 chip 12sm in 04 6sm und in 06 3sm
Flächenverlust etwa 15%
Ergibt dann mit blackwell 112*12 (sm in einen gpc)*12 gpc*2 operationen pro Takt*2,5ghz=80tf oder 92tf mal 2 wegen mcm
160tf oder 184tf 2025 niemals mit gd7 auslastbar
lovelace wir nur ein drittel der leistung haben und gddr7 reicht nicht aus. das max wären 1536gb/s

GB102 wird definitiv datacenter only auch wenn nvidia die shader module nicht ändert.

ad102 wäre zu teuer.
letzter leak war
ad102 144sm 136sm als sku in professionell sektor nur 26 chips gut 50 chips schlecht mögliche sku mit 108-120sm
ad103 120sm=96sm als sku
ad104 60sm =52sm als sku
ad106 36sm=32sm als sku
ad107 24sm= 20sm als sku
man peilt die 2,2ghz-2,3ghz an
1sm =96 fp32 shader

ich nahm an das nvidia lovelace etwa 30% shrinken kann von samsung aus

Mögliche ein gb vram Preise ab 2023
gddr6 20-24gbits 8$
gddr6 16gbits wenn noch produziert wird 6$
gddr7 32gbits 10-12$ unklar

und bei allen vorausgesetzt unser pandemi ist vorbei und es gibt keinen Weltkrieg
 
Naja heutzutage kann man wohl vergessen bei gleichen Stromverbrauch mehr Leistung zu bekommen
Das geht schon - nur muss man dafür ggf. die Betriebspunkte der Karten manuell weg von "MEHR POWER!!!" hin zu effizient schieben.
Es hat heute schon gar keinen Sinn, 350W in eine 3080Ti reinzupressen wo die Karte mit 250W bzw. bei 0,8v und 200 MHz weniger nur 10% langsamer ist. Je größer der Chip dabei ist desto massiver wird der Effekt. Wenn man tatsächlich einen großen "Ada"-Chip mit weit über 10.000 Shadereinheiten nimmt und ihn weniger am Vollanschlag betreibt wie das ab Werk wohl vermutlich wieder eingestellt sein wird bin ich mir sicher, dass auch diese Karten im Bereich von 250-300W verdammt gut und effizient performen können. Der Besitzer muss dafür nur bereit sein, auf die letzten 10-15% Performance (die 100-200W extra kosten) zu verzichten die in aller Regel sowieso keinen praktischen Unterschied machen.
Ob ich meine RTX2080 mit 180W oder 250+W bespaße macht um die 150MHz Boost und in Spielen meist nur ne kleine einstellige Zahl an fps aus. Wer wirklich nur vernünftig (effizient, leise, verschleißarm,...) spielen will und keinen Benchmarkvergleich anstrebt fährt so einfach viel viel besser.

Was den Artikel/Thema angeht:
Ich liebe ja solche "leaks" wo wieder irgendwas "durchgesickert" ist was erstens jeder in der Szene sowieso schon lange wusste und vor allem was völlig belanglos ist (wen interessiert denn ernsthaft wie die Architektur benannt ist...?). Faktisch ist nur mehr oder weniger klar bzw. sehr wahrscheinlich, dass es mehrere Chips geben wird, die AD10irgendwas heißen, Ende des Jahres irgendwann kommen, deutlich schneller werden als Ampere durch aufblasen von Chip und Fertigung und in der Spitze einen A... voll Strom fressen werden. All das war vor dem "Leak" auch schon klar. :ka:
 
man kann allerdings nicht jeden chips gleich weit drosseln.WEnn man wie du schreibst dann auf nur 75 Watt kommen will,dann geht das mit den rieseigen chips eben leider nicht mehr.Weil man ja nur bis zu einem gewissen Punkt die SPannung reduzieren kann.Also ist da klar nen limit festzustellen.
 
nicht realistisch
Nun mein zen 2 211 cb15 rtx3060 gpu load von 47 games gpu intensiv 92% 1080p
rtx3090 doppelt so schnell 2160p braucht 75% mehr Leistung im schlimmsten Fall
zen 3 cb15 270 = +28%
Rtx 3060ti etwa 30% mehr leistung in 1080p mit zen 3 optimal
rtx 3070 50% schneller als rtx3060 cp ulimit auf 1080p in 1440p etwa 33% mehr leistung benötigt ideal
rtx3080 91% mehr leistung erst auf 4k ausgelastet möglich biss zu 80% gpu load
rtx3090 102% mehr Leistung gpu load bei etwa 70%
Das sind diese spiele Ohne msaa

Spiele aus den Jahren 2016-2021 rtx 3060
GPU load %​
Rise of the tomb raider
96,00 %​
Deus ex mankind divided
96,00 %​
Dying light -the following
92,00 %​
Watch dogs 2
98,00 %​
Tes skyrim HD se
95,00 %​
Doom 2016
66,00 %​
Shadow warrior 2
76,00 %​
hitman
97,00 %​
Mafia 3
97,00 %​
Wolfenstein 2 the new collossos
93,00 %​
Resident evil 7
99,00 %​
Dirt 4
98,00 %​
Prey 2017
66,00 %​
Mittelerde Mordors Schatten
96,00 %​
Hellblade sanua’s sacrifice
98,00 %​
Warhammer dawn of war 3
90,00 %​
Dishonord death of the outsider
71,00 %​
Sniper elite 4
97,00 %​
TC g r wildlands
97,00 %​
Sniper ghost warrior 3
94,00 %​
Forza horizon 4
97,00 %​
Shadow of the tomb raider
98,00 %​
F1 2018
99,00 %​
Far cry 5
87,00 %​
Kingdom come Deliverance
89,00 %​
Red Faction: Guerrilla Re-Mars-tered (Remaster)
75,00 %​
Anno 1800
94,00 %​
F1 2019
97,00 %​
Metro exodus
97,00 %​
Control
97,00 %​
Far cry new dawn
83,00 %​
Rage 2
97,00 %​
Wolfenstein youngblood
96,00 %​
Tc ghost recon breakpoint
96,00 %​
Mittelerde shadow of war
100,00 %​
Just cause 4
96,00 %​
Borderlands 3
96,00 %​
Dirt rally 2
98,00 %​
Cyberpunk 2077
98,00 %​
SE Ghost warrior contracts
99,00 %​
Doom eternal
99,00 %​
Gears tactics
96,00 %​
Immortals fenix rising
95,00 %​
Dirt 5
99,00 %​
Watch dogs legion
99,00 %​
Days gone
99,00 %​
93,22 %​
Ergo
93% gpu load​

In dxr mögliche 100% gpu load
heftigste dxr spiele in 1080p

metro exodus ee avg fps rtx3060 etwa 30 ohne dlss (extreme settings)
control avg fps rtx 3060 60 ohne dlss
cyberpunk 2077 avg fps rtx3060 35 ohne dlss (psycho settings)
dying light 2 avg fps rtx3060 45 ohne dlss
minecraft rtx etwa 30fps
watch dogs legion etwa 40fps

ja ich weiß das paar spiele in cpu limit kommen wegen fps cap (bsp doom)
neu würde ich noch dying light 2 (99% gpu load) und farcry 6 dazu setzen was auch mit dxr maximal 85% gpu load hat auf 1080p ohne fsr
Das aber hängt stark vom Treiber ab derzeitiger 500gen ist noch bis zu 85% load gab auch Revesionen wo dieser nur bis 65% gpu load kam.
Und ja cpu limit lässt sich schwerlich mit gpu load % abgleichen im groben sollte das aber passen
Den je mehr das OS auf mehr kerne ausweichen kann desto mehr ipc eines kern wird frei folglich steigen die fps an und somit die Auslastung der gpu.
Das ist spiel engine abhängig
Zudem ist der Maßstab wieviel tf man braucht auch von der bandbreite abhängig
Und jedes spiel sofern tripple aaa wird auf konsolen hin designet
Specs der
ps4 190gb/s etwa 1,8tf
ps4 pro 230gb/s 4,0tf
ps5 576gb/s 10,5tf
ps6 vermutlich 2025 28-32tf 912gb/s 256bit si mit 32gbits gddr7 +256mb inf cache

Daran werden spiele hin designet derzeit reicht aber der standard von ps4 pro aus.
PS5 wird in naher Zukunft das minimum sein, maßgeblich für dxr auf level der rtx2060 bzw rx6700xt
was dann etwa 500gb/s wären mit 10tf mit nah meine ich 2023 wo die ersten spiele auf dxr basis kommen. Im übrigen 30fps ziel bei 1440p
Darum ist meine Behauptung ab 2025 mit in der Mittelklasse 29tf exakt der punkt für 1440p wo aktuell die rtx3090 im cpu limit lauert.
Und die cpu ipc gains sind bei zen 4 nur 25% von zen3 aus sprich 330
das ist zugegeben weniger als gedacht aber durchaus glaubhaft ich sehe da maximal eine Auslastung von 40tf was exakt die rtx4090 mit dem ad104 (neue info ad103 10gpc=100sm 96 aktiv) passt
Der ad102 mit 136sm wird definitiv bei 2,2ghz und 57tf nicht am desktop kommen. zu teuer.~412$-660$
endkunden preise 1699€ oder 2299€
Und eine sku mit nur 120sm dann 1399-1699€
jeweils 16gb gd7 32gbits
Im übrigen verhungern diese chips am SI ab 50tf wirds eng mit 384bit und nur 1536gb/s
ad103 vermute ich 320bit mit 32gbits=1280gb/s
Das könnte reichen
oder nvidia nutzt HBM2e mit 3,2ghz=3278gb/s an 4096bit für 57tf
ich behaupte mal frech das nvidia die architeur des Sm ändert auf 128 fp32
sprich 64fp32 und 64 fp64
Derzeit 64 fp32 und 32 fp64 (können 2 operationen in einen Takt)=96 fp32 von 128 shader von nvidia marketing was real aber 64 fp32 und 64 int32 sind.
Die int32 können kein floating point mehr.
nachzulesen in dem Whitepaper ampere von 2020
Anhang anzeigen 1389396
Anhang anzeigen 1389397

Mögliche Änderung nochmal 32 fp64 dazu oder nochmal 16 fp32
Entweder 128 shader oder 112 pro sm in 02 chip 12sm in 04 6sm und in 06 3sm
Flächenverlust etwa 15%
Ergibt dann mit blackwell 112*12 (sm in einen gpc)*12 gpc*2 operationen pro Takt*2,5ghz=80tf oder 92tf mal 2 wegen mcm
160tf oder 184tf 2025 niemals mit gd7 auslastbar
lovelace wir nur ein drittel der leistung haben und gddr7 reicht nicht aus. das max wären 1536gb/s

GB102 wird definitiv datacenter only auch wenn nvidia die shader module nicht ändert.

ad102 wäre zu teuer.
letzter leak war
ad102 144sm 136sm als sku in professionell sektor nur 26 chips gut 50 chips schlecht mögliche sku mit 108-120sm
ad103 120sm=96sm als sku
ad104 60sm =52sm als sku
ad106 36sm=32sm als sku
ad107 24sm= 20sm als sku
man peilt die 2,2ghz-2,3ghz an
1sm =96 fp32 shader

ich nahm an das nvidia lovelace etwa 30% shrinken kann von samsung aus

Mögliche ein gb vram Preise ab 2023
gddr6 20-24gbits 8$
gddr6 16gbits wenn noch produziert wird 6$
gddr7 32gbits 10-12$ unklar

und bei allen vorausgesetzt unser pandemi ist vorbei und es gibt keinen Weltkrieg
Ahhh und wieder nur Mist....

Der ad 102 wird nicht kommen ?

Ich erinnere dich dann bei der Vorstellung gerne wieder daran....

Was is daran nicht zu verstehen....
Der 100er is der big chip und der 102 der big chip im desktop Bereich das is Fakt seit vielen Gens aber du weißt es ja natürlich besser sitzt ja in der Entwicklung ..

Bring lieber Fakten und lass endlich diese Behauptungen....
Wer sagt den das es keine Weiterentwicklung bei gddr6x oder nicht gleich gddr7 kommt....
Sie haben mit Micron ja schon gddr6x exklusiv entwickelt
Das wusste vorher ja auch keiner...Also bitte....
Nvidia weiß mit Sicherheit besser was sie tun als so ein forum wichtigtuer wie du...

Und nochmal danke angeblichen Hochrechnungen haben noch nie gestimmt....

Wie oft noch jetzt der 100er is der fürs datacenter und der 102 is der big chip im desktop Bereich.....
Checkst du das jetzt endlich mal....

Mal abgesehen davon der angebliche 103er kam ja nicht mal bei Turiner oder ampere aber klar das der natürlich jetzt kommen soll....

Schau lieber auf vergangene Fakten und propagier net immer so einen Unsinn....
 
man kann allerdings nicht jeden chips gleich weit drosseln.
Das stimmt natürlich. Der (effiziente) Sweetspot ist auch nach unten begrenzt, hauptsächlich dadurch dass eine gewisse Mindestspannung nötig ist damit ein Chip überhaupt unter Last stabil funktioniert (bei modernen Chips irgendwo um die 0,7-0,8v herum). Auf 75W herunterkommen ist natürlich mit einem großen CHip nicht machbar - als Karten-TDP schon gar nicht weil schneller GDDR-Speicher plus PCB/MosFET dieses Energiuebudget schon ganz ohne die GPU auffressen. Dafür müssen dann eben die kleineren Chips herhalten - Grafikkarten die mit 100-120W TDP verkauft werden kann man in aller Regel schon auf 75W gut betreiben.

Ganz unten kanns wirklich passieren dass man da nicht mehr hinkommt einfach weil das generelle "Level" der Karten so stark angehoben wird. Aber PCs die für die Grafikleistung deutlich unter 100W ansetzen sind auch vermutlich die, die auch mit GPUs von ein, zwei Generationen der vergangenheit noch gut auskommen können.
 
Das geht schon - nur muss man dafür ggf. die Betriebspunkte der Karten manuell weg von "MEHR POWER!!!" hin zu effizient schieben.
Es hat heute schon gar keinen Sinn, 350W in eine 3080Ti reinzupressen wo die Karte mit 250W bzw. bei 0,8v und 200 MHz weniger nur 10% langsamer ist. Je größer der Chip dabei ist desto massiver wird der Effekt. Wenn man tatsächlich einen großen "Ada"-Chip mit weit über 10.000 Shadereinheiten nimmt und ihn weniger am Vollanschlag betreibt wie das ab Werk wohl vermutlich wieder eingestellt sein wird bin ich mir sicher, dass auch diese Karten im Bereich von 250-300W verdammt gut und effizient performen können. Der Besitzer muss dafür nur bereit sein, auf die letzten 10-15% Performance (die 100-200W extra kosten) zu verzichten die in aller Regel sowieso keinen praktischen Unterschied machen.
Ob ich meine RTX2080 mit 180W oder 250+W bespaße macht um die 150MHz Boost und in Spielen meist nur ne kleine einstellige Zahl an fps aus. Wer wirklich nur vernünftig (effizient, leise, verschleißarm,...) spielen will und keinen Benchmarkvergleich anstrebt fährt so einfach viel viel besser.

Was den Artikel/Thema angeht:
Ich liebe ja solche "leaks" wo wieder irgendwas "durchgesickert" ist was erstens jeder in der Szene sowieso schon lange wusste und vor allem was völlig belanglos ist (wen interessiert denn ernsthaft wie die Architektur benannt ist...?). Faktisch ist nur mehr oder weniger klar bzw. sehr wahrscheinlich, dass es mehrere Chips geben wird, die AD10irgendwas heißen, Ende des Jahres irgendwann kommen, deutlich schneller werden als Ampere durch aufblasen von Chip und Fertigung und in der Spitze einen A... voll Strom fressen werden. All das war vor dem "Leak" auch schon klar. :ka:
In der Regel macht das schon einen Unterschied aus zb wenn ein Spiel damit eben nicht die 4k maxed out@60 schafft dann braucht man eben die Leistung

Mal davon abgesehen wenn ich die 3090 drossel um 10%-15 dann kann ich gleich zu einer 3080 greifen...macht dann keinen Sinn

Wer sich ne 3090 zulegt der will maximale Leistung und dem is auch der Verbrauch völlig egal

Wem der Verbrauch wichtig is der greift eben ein oder zwei regale weiter unten zu
 
Mal davon abgesehen wenn ich die 3090 drossel um 10%-15 dann kann ich gleich zu einer 3080 greifen...macht dann keinen Sinn
Persönliche Meinung: Die absolute Topend-Karte hat ohnehin nur in wenigen Spezialfällen Sinn. Für die letzten +10% performance das Doppelte zu zahlen ist genauso unsinnig wie dafür +30% Strom reinzuballern.^^
Wie du schon sagst wer ne 3090 kauft dem ist sowas sowieso egal - aber es geht (mir) hier auch absolut nicht um den Verbrauch (finanziell) - ob meine GPU 200 oder 500W frisst sind bei meiner Spielzeit nur ne Handvoll Euro unterschied aufs Jahr gesehen, das ist völlig belanglos. Es geht darum dass die Kiste dann laut wird und ich heiße Füße bekomme. :-P
(Und mein innerer Ingenieurseffizienzmongo kriegt halt Blutdruck von sowas :haha: )
 
Persönliche Meinung: Die absolute Topend-Karte hat ohnehin nur in wenigen Spezialfällen Sinn. Für die letzten +10% performance das Doppelte zu zahlen ist genauso unsinnig wie dafür +30% Strom reinzuballern.^^
Wie du schon sagst wer ne 3090 kauft dem ist sowas sowieso egal - aber es geht (mir) hier auch absolut nicht um den Verbrauch (finanziell) - ob meine GPU 200 oder 500W frisst sind bei meiner Spielzeit nur ne Handvoll Euro unterschied aufs Jahr gesehen, das ist völlig belanglos. Es geht darum dass die Kiste dann laut wird und ich heiße Füße bekomme. :-P
(Und mein innerer Ingenieurseffizienzmongo kriegt halt Blutdruck von sowas :haha: )
Also das doppelte hab ich jetzt nicht zahlen müssen ?

Auch laut is se nie gewesen
75 grad is jetzt für ne Luft gekühlte karte auch nix
Also es geht schon wenn man einen gewissen airflow hat und gute Lüfter besitzt
Jetzt kümmert mich es eh nimmer is bei mir unter Wasser ?

Selbst man zb gute 4 bis 6 Std täglich zockt macht das auch nix auf der Strom Rechnung aus ?
 
So gestern auf wcctf
1646197148692.png


davor bei kopi... aus twitter quelle 3dcenter
1646197668760.png


Darum eine Annahme 10gpc für den ad103 die info war mir neu aber durch gestrigen leak um 11 uhr nachts also dann als ich den beitrag schrieb wurde das bestätigt das einzige was nicht stimmmte war ad103 84sm (7gpc)
der rest stimmte

Zum analyse der preise
nvidia marge üblich 70% geht aus den quartalsberichten hervor
aib marge die übliche menge ab 20%
großhandel im schnitt bei hardware 10% je knapper desto höher der Anteil.
einzelhandel derzeit 10%
transport durch unsere pandemi liegen diese bei etwa 20-30$ pro sku luftfracht, schiff liegt derzeit bei 10$
vram kosten 1gb gddr6 16gbits aktuell 10$ wird alsbald von 20gbits ersetzt
1gb gddr6x 9$ trend fallend
1gb hbm2e 3,2ghz =18$ das sind aber stacks von 8gb=144$ bsp war samsung
quelle alibaba
chipgrößen quelle tsmc
vergleich ampere ga100 128sm/144sm physisch 12gpc 826mm²
samsung 8nm ad102 8gpc=96sm 628mm²
Differenz 13%
Möglicher shrink auf 70% vom 8nm machbar
tsmc Angabe zu 7 vs 5nm mögliche specs
45% denser by same clocks 30% energy efficient or 15% more clocks
1646201604828.png

Nach Vernunft wird nvidia den Takt so weit wie möglich puschen letzter leak war 2,2-2,3ghz
1646198683701.png

Woher diese info stammt unklar

ich glaube aber das nvidia nur auf maxed 100mrd geht quasi 30% aufgrund von wärmedichte und Takt.
61,2 vs 100= 40% possible 5nm unklar ob machbar da dies zwingend eine hohe wärmedichte gibt zudem lassen sich sram sowie tensor cores schlecht verkleinern
Die reinen sm sehr wohl fp32 shader müssten um 60% kleiner werden wo tensor cores nahezu bei 10% sind und die dedizierten fp64 nur um 30% saram wierd ich nicht ändrn es bleibt bei breiten strukturen also nur 10% in maximum tmu rop bedingt shrink fähig ich gehe von maxed 20% aus. ~30% pi mal dauemen aufgerundet von 26% grund samsung node ist etwa 3% größer als 7nm
taktraten andere quelle
1646199742880.png

ich finde nicht den twitter Eintrag dessen nicht sollte aber von greymon stammen

so ganz aus der Luft gegriffen sind meine angaben nicht
Die waferpreise wurden durch den nvidia hack bestätigt.
analyse meinerseits der marktlage kommen also hin.
Die Unklarheit kommt aber von 2 dingen was kann intel dagegensetzen und wann wird die chipknappheit aufhören mein tipp etwa q2 2023 wird es auf normalen niveau kommen

Architecure bsp hopper/blackwell rdna3 und rdna4
nun mcm wird einiges ändern und beim letzten post von mir ging ich von 4 chips bei nvidia aus und bei amd sind es 2 chips plus brückenchip erste gen mit rdna3 rdna4 wird 4 chips haben
das geht aus nen patent heraus
nvidia dagegen wird wohl der hack das offenlegen. ich gehe aber von min 2 chips aus erste gen und danach mit 4chips mögliche gpc pro chip 5*12*128/112alu für fp32 (60sm etwa 100mm²)
nvidia mcm kommt erst 2026 am desktop an hopper wird 2024 hpc exklusiv
nvidia wird lovelace auf 4nm refreshen bzw das lineup vollständig sein.
3nm sind quasi Bedingung für blackwell
Gerücht zu 3nm schlechten yield bei tsmc


Daher gehe ich fasst davon aus das amd rdna 4 und nvidia lovelace refreshen wird 2024
Für mcm und vermuteten 144sm pro chip wird das nix wie von mir berechnet
~753mm² ein DIE auf 3nm dann 247mm²
Die chips müssten über ne brücke oder activen interposer verbunden werden
Intel nennt den chip emib und da asml maximale Belichtung bei 900mm² liegt sind die erforderlichen 1500mm² nicht herrstellbar daher muss nvidia auf 3nm sein für hopper / blackwell
Welche codename am deskrop kommen ist unklar bestätigt sind gh100/102 und gb102/104 für high end skus
wann ist offen (2024-2026) den ohne 3nm und somit etwa 80% kleiner als 8nm kann man das getrost vergessen.
Das sind im übrigen alles öffentlich zugängliche infos.
achja man kann denser gehen und mehr takt erreichen oder gleicher takt und mehr verbrauch
da nvidia nur 10% an takt geht nehme ich an das die möglichen 30% voll genutzt werden der node kann 48% kleiner werden aber die wärmedichte wird zum problem zudem wie ich beschrieb lässt sich nur ein teil des chips auf amximale dichte reduzieren im üblichen sind das di transistoren bei den alu aber sram kann man knicken.
was aber an der belichtung und der Datenntrigität liegt
Das aber ist prozess abhängig wie oben zu sehen maxed bei 5n -45% was aber aufgrund des sram Ausgeshlossen ist
anders sieht es bei 3nm aus und gaa da erwarte ich grobe 50% kleiner.
Gaa = gate all around Einführung 2023 bei n3p derzeit in sample bei tsmc siehe apple news zu m2.
tsmc 7nm vs samsung 8nm sind 13% größer errechnet durch ga100 vs ga102 auf gleiche shadermenge.
Daher sind tendenz zu 40% kleiner aber unwahrscheinlich darum die 30% im schnitt.
 

Anhänge

  • 1646199175570.png
    1646199175570.png
    101 KB · Aufrufe: 11
Zuletzt bearbeitet:
So gestern auf wcctf
Anhang anzeigen 1389413

davor bei kopi... aus twitter quelle 3dcenter
Anhang anzeigen 1389414

Darum eine Annahme 10gpc für den ad103 die info war mir neu aber durch gestrigen leak um 11 uhr nachts also dann als ich den beitrag schrieb wurde das bestätigt das einzige was nicht stimmmte war ad103 84sm (7gpc)
der rest stimmte

Zum analyse der preise
nvidia marge üblich 70% geht aus den quartalsberichten hervor
aib marge die übliche menge ab 20%
großhandel im schnitt bei hardware 10% je knapper desto höher der Anteil.
einzelhandel derzeit 10%
transport durch unsere pandemi liegen diese bei etwa 20-30$ pro sku luftfracht, schiff liegt derzeit bei 10$
vram kosten 1gb gddr6 16gbits aktuell 10$ wird alsbald von 20gbits ersetzt
1gb gddr6x 9$ trend fallend
1gb hbm2e 3,2ghz =18$ das sind aber stacks von 8gb=144$ bsp war samsung
quelle alibaba
chipgrößen quelle tsmc
vergleich ampere ga100 128sm/144sm physisch 12gpc 826mm²
samsung 8nm ad102 8gpc=96sm 628mm²
Differenz 13%
Möglicher shrink auf 70% vom 8nm machbar
tsmc Angabe zu 7 vs 5nm mögliche specs
45% denser by same clocks 30% energy efficient or 15% more clocks
Anhang anzeigen 1389418
Nach Vernunft wird nvidia den Takt so weit wie möglich puschen letzter leak war 2,2-2,3ghz
Anhang anzeigen 1389415
Woher diese info stammt unklar

ich glaube aber das nvidia nur auf maxed 100mrd geht quasi 30% aufgrund von wärmedichte und Takt.
61,2 vs 100= 40% possible 5nm unklar ob machbar da dies zwingend eine hohe wärmedichte gibt zudem lassen sich sram sowie tensor cores schlecht verkleinern
Die reinen sm sehr wohl fp32 shader müssten um 60% kleiner werden wo tensor cores nahezu bei 10% sind und die dedizierten fp64 nur um 30% saram wierd ich nicht ändrn es bleibt bei breiten strukturen also nur 10% in maximum tmu rop bedingt shrink fähig ich gehe von maxed 20% aus. ~30% pi mal dauemen aufgerundet von 26% grund samsung node ist etwa 3% größer als 7nm
taktraten andere quelle
Anhang anzeigen 1389417
ich finde nicht den twitter Eintrag dessen nicht sollte aber von greymon stammen

so ganz aus der Luft gegriffen sind meine angaben nicht
Die waferpreise wurden durch den nvidia hack bestätigt.
analyse meinerseits der marktlage kommen also hin.
Die Unklarheit kommt aber von 2 dingen was kann intel dagegensetzen und wann wird die chipknappheit aufhören mein tipp etwa q2 2023 wird es auf normalen niveau kommen

Architecure bsp hopper/blackwell rdna3 und rdna4
nun mcm wird einiges ändern und beim letzten post von mir ging ich von 4 chips bei nvidia aus und bei amd sind es 2 chips plus brückenchip erste gen mit rdna3 rdna4 wird 4 chips haben
das geht aus nen patent heraus
nvidia dagegen wird wohl der hack das offenlegen. ich gehe aber von min 2 chips aus erste gen und danach mit 4chips mögliche gpc pro chip 5*12*128/112alu für fp32 (60sm etwa 100mm²)
nvidia mcm kommt erst 2026 am desktop an hopper wird 2024 hpc exklusiv
nvidia wird lovelace auf 4nm refreshen bzw das lineup vollständig sein.
3nm sind quasi Bedingung für blackwell
Gerücht zu 3nm schlechten yield bei tsmc


Daher gehe ich fasst davon aus das amd rdna 4 und nvidia lovelace refreshen wird 2024
Für mcm und vermuteten 144sm pro chip wird das nix wie von mir berechnet
~753mm² ein DIE auf 3nm dann 247mm²
Die chips müssten über ne brücke oder activen interposer verbunden werden
Intel nennt den chip emib und da asml maximale Belichtung bei 900mm² liegt sind die erforderlichen 1500mm² nicht herrstellbar daher muss nvidia auf 3nm sein für hopper / blackwell
Welche codename am deskrop kommen ist unklar bestätigt sind gh100/102 und gb102/104 für high end skus
wann ist offen (2024-2026) den ohne 3nm und somit etwa 80% kleiner als 8nm kann man das getrost vergessen.
Das sind im übrigen alles öffentlich zugängliche infos.
achja man kann denser gehen und mehr takt erreichen oder gleicher takt und mehr verbrauch
da nvidia nur 10% an takt geht nehme ich an das die möglichen 30% voll genutzt werden der node kann 48% kleiner werden aber die wärmedichte wird zum problem zudem wie ich beschrieb lässt sich nur ein teil des chips auf amximale dichte reduzieren im üblichen sind das di transistoren bei den alu aber sram kann man knicken.
was aber an der belichtung und der Datenntrigität liegt
Das aber ist prozess abhängig wie oben zu sehen maxed bei 5n -45% was aber aufgrund des sram Ausgeshlossen ist
anders sieht es bei 3nm aus und gaa da erwarte ich grobe 50% kleiner.
Gaa = gate all around Einführung 2023 bei n3p derzeit in sample bei tsmc siehe apple news zu m2.
tsmc 7nm vs samsung 8nm sind 13% größer errechnet durch ga100 vs ga102 auf gleiche shadermenge.
Daher sind tendenz zu 40% kleiner aber unwahrscheinlich darum die 30% im schnitt.
Dann lies nochmal nach wenn du schon nicht mal weißt was du schreibst....

Du hast wortwörtlich behauptet der ga 102 wird im desktop nicht kommen....

Komisch nur das der immer kam Ergo Fake news....
Das es nur 10% höherer takt wird steht ebenfalls nicht fest man spricht momentan von 2,5ghz Ergo mehr als 10%

Ich sags nochmal komm mit Fakten und bleib bei der Wahrheit und verdrehen die nicht wie es dir passt
 
Wem der Verbrauch wichtig is der greift eben ein oder zwei regale weiter unten zu
Ja nur wie man man das so wie ich der wo eh zu der 75 Watt GPU greift. Es gibt ja keinen 75 Watt Nachfolger mehr weil alle mehr verbrauchen. Also muss ich langfristig ne GPU wählen die so 125 Watt oder 120 Watt Verbrauch hat oder halt 140 Watt und diese dann auf 75 Watt drosseln. Ob die dann besser sein werden als ne GTX 1650 mit seinen 75 Watt ist ne andere Frage oder kann man da trotz dessen mit einer gewissen mehr Leistung schon rechnen also sprich unter diesen bedingung ?
 
Also muss ich langfristig ne GPU wählen die so 125 Watt oder 120 Watt Verbrauch hat oder halt 140 Watt und diese dann auf 75 Watt drosseln. Ob die dann besser sein werden als ne GTX 1650 mit seinen 75 Watt ist ne andere Frage oder kann man da trotz dessen mit einer gewissen mehr Leistung schon rechnen also sprich unter diesen bedingung ?
In aller Regel sind die genannten Bedingungen auch schneller. Da sich aber an der grundlegenden Architektur wenig ändert darfste da keine großen Sprünge erwarten. Das schneller bei gleicher TDP kommt dann nur von ein paar Hundert MHz mehr Takt die durch den feineren Fertigungsprozeß mehr drin sind.
Gegenüber Turing light (also GTX1650/1660) sollte ein auf 75W gedrosselter AD107 (der vom Shaderausbau her vergleichbar mit TU104 ist) aber dennoch deutlich schneller sein, alles andere wäre ziemlich enttäuschend.
 
Zurück