Gewagtes Experiment, bei der GTX 970 moeglich?

Es ändert sich nur die Zeit in der du den Gesamten speicher auslesen kannst. Wie schnell du einzelne Daten abrufen kannst bleibt bis auf den worst case identisch

Bzw. Zugriff auf ein einziges Datenpaket bleibt gleich es sei denn du gehst davon aus das der Steuerbus des Speichercontrollers 2 Taktzyklen benötigt für die er davor eine gebraucht hat. So spezifisch optimiert dürfte die Architektur aber nicht sein.
 
vllt reden wir von verschiedenen sachen?
mich interessiert das thema sehr! knogle ist der erste kranke der es versuchen will. ich glaube jeder hat schon mal ein gedanken verschwendet an so ein projekt. :ugly:
 
Soweit ich das in Erinnerung habe erfolgt der Speicherzugriff parallel über den Bus, d. h. jeder der 32 Bit Speicherkanäle (GDDR5) bekommt eine eigene Anbindung an den "Crossbar" über eine ROP/L2 Einheit. Die GTX970 hat aber eine ROP/L2 Einheit weniger, d. h. 7 Ports am Crossbar für 8 Speicherkanäle. Macht also 7 * 32 Bit = 224 Bit schnell, 1 * 32 Bit langsam.
 
Gut nochmal :D

Stryke7

Das musst du mir jetzt mal genau erklären wie die doppelte Speicherbestückung das Interface effektiv halbiert :what:

Wenn von Adresse a etwas benötigt wird holt sich der Speichercontroller was er von adresse a haben muss... Es verdoppelt sich nur die Zeit die benötigt wird den gesammten Vram auszulesen aber das ist nicht gerade Praxisnah.

Ja, ich glaube du verstehst das Problem.
Du kannst natürlich die doppelte Menge Daten durch den gleichen Bus schicken, es dauert dann aber eben doppelt so lange. Und das ist ein Problem.
Die "richtige" Methode (als Hersteller) ist es eben, bei Verdoppelung der Datenmenge auch den Bus auf das Doppelte zu vergrößern, damit die Übertragung nicht langsamer wird.
Aber genau das kann der TE nun mal nicht machen.

Und die Übertragungszeit ist nunmal sehr entscheidend, da die GPU sonst länger auf ihre Daten warten muss und weniger arbeiten kann, wodurch du am Ende weniger Bilder pro Sekunde rausbekommst.


genau auf diese frage will ich auch eine antwort haben! :daumen:
er lötet ja nicht weitere bausteine an sondern erweitert nur deren kapazität?!

Ok, neues Beispiel:

Du hast 8 Waschbecken, aus denen pro Sekunde ein halber Liter Wasser fließt.

(Waschbecken = Speicherbausteine, 0,5l Wasser = Menge der Daten die pro Sekunde zu einem 512MB-VRAM-Modul geschickt/geholt werden müssen)

Diese Waschbecken laufen am Ende in ein gemeinsames Abwasserrohr, welches also entsprechend 8x so groß sein sollte wie der Abfluss eines Waschbeckens, (utner der Vorraussetzung dass die Flussgeschwindigkeit konstant ist).

Das Grundproblem der GTX970 ist schon mal, dass das gemeinsame Abwasserrohr nicht 8x, sonder nur 7x so groß ist wie die Abflüsse der Waschbecken, wodurch sich Wasser zurückstaut (= Daten langsamer fließen, dadurch wird die Grafikkarte gebremst).


Wenn du nun jedes Waschbecken (und die Menge des daraußfließenden Wassers) auf das Doppelte vergrößerst, aber das gemeinsame Abwasserrohr nicht, so wird der Rückstau nur viel schlimmer.


Soweit verständlich?


Nun, die Grafikkarte kann also ihre Daten trotz größerem Speicher nicht schneller bekommen, will aber viel mehr hin- und herschicken. Dadurch wird sie jetztendlich nur gebremst.
 
Wenn man nun bei der GTX 970 sich das ansieht.

7x512 @224bit + 1x512 @32bit = 3,5GB+512MB. Diese tauscht man dann mit 7x1024 @224bit und 1x1024@32bit was dann sozusagen 7GB+1GB sind.

Die Bandbreite ist natürlich die selbe wie vorher.

PS: Kann das sein das wir alle das Selbe meinen :lol:
 
Soweit ich das in Erinnerung habe erfolgt der Speicherzugriff parallel über den Bus, d. h. jeder der 32 Bit Speicherkanäle (GDDR5) bekommt eine eigene Anbindung an den "Crossbar" über eine ROP/L2 Einheit. Die GTX970 hat aber eine ROP/L2 Einheit weniger, d. h. 7 Ports am Crossbar für 8 Speicherkanäle. Macht also 7 * 32 Bit = 224 Bit schnell, 1 * 32 Bit langsam.
so in etwa meinte ich es auch nur in einfach :ugly:
verstehe ich es richtig egal ob an 32bit 512 oder 1024 bausteine sind spielt nicht die geige?

edit: ja ich meine das selbe!
 
so in etwa meinte ich es auch nur in einfach :ugly:
verstehe ich es richtig egal ob an 32bit 512 oder 1024 bausteine sind spielt nicht die geige?
GDDR5 ist mit einem 32 Bit breiten Speicherkanal angebunden. Die 512/1024 Bit beziehen sich auf die Speicherkapazizät, das ist wieder was anderes.

7x512 @224bit + 1x512 @32bit = 3,5GB+512MB. Diese tauscht man dann mit 7x1024 @224bit und 1x1024@32bit was dann sozusagen 7GB+1GB sind.

Die Bandbreite ist natürlich die selbe wie vorher.
Genau so sieht das dann nämlich aus.
 
Wenn man nun bei der GTX 970 sich das ansieht.

7x512 @224bit + 1x512 @32bit = 3,5GB+512MB. Diese tauscht man dann mit 7x1024 @224bit und 1x1024@32bit was dann sozusagen 7GB+1GB sind.

Die Bandbreite ist natürlich die selbe wie vorher.

PS: Kann das sein das wir alle das Selbe meinen :lol:

Korrekt, aber du vergisst die zeitkritische Übertragung.

Und du kannst nach wie vor nur die gleiche Menge an Daten pro Zeit dadurch schicken wie vorher, möchtest aber gerne die doppelte Menge übertragen.
 
Nein, du hast 196 GB/s maximal, da ändert sich nichts dran. Das hat hier auch soweit ich das gesehen habe keiner behauptet.
 
jetzt müsst ihr mir das aber mal bei den anderen karten erklären mit doppelten speicher.
ich habe es so verstanden: auf grund der problematik der gtx970 bringt der doppelte speicher nichts!
würde ich aber eine gtx980 nehmen müsste es funzen oder wie?
wo ist der erklärbär wenn man ihn braucht?!
 
Gut nochmal :D



Ja, ich glaube du verstehst das Problem.
Du kannst natürlich die doppelte Menge Daten durch den gleichen Bus schicken, es dauert dann aber eben doppelt so lange. Und das ist ein Problem.
Die "richtige" Methode (als Hersteller) ist es eben, bei Verdoppelung der Datenmenge auch den Bus auf das Doppelte zu vergrößern, damit die Übertragung nicht langsamer wird.
Aber genau das kann der TE nun mal nicht machen.

Und die Übertragungszeit ist nunmal sehr entscheidend, da die GPU sonst länger auf ihre Daten warten muss und weniger arbeiten kann, wodurch du am Ende weniger Bilder pro Sekunde rausbekommst.
Das Problem habe ich schon verstanden ist ja mein Studiengebiet :D

Edit: Ich wollte nur nicht das wir aneinander Vorbei reden, da die Zeitkritische Komponente mit der Größe des Vrams erst einmal nichts zu tun hat.

Eine Textur hat jetzt 16Mib d.h bei 8 Speichersteinen für jeden 2MiB. Wird auf diese Textur Zugegriffen werden aus jedem Speicherstein diese 2MiB mit einem 32bit bus ausgelesen.
Da ist es erstmal egal ob der Speicher 2MiB oder 1024MiB groß ist es kommt auf das selbe raus.

Was du meinst ist, dass die Software für ein Frame statt 3GB -> 6GB benötigt und desshalb sich die FPS halbieren. Nun ist es aber so dass mehr Vram hauptsächlich benötigt wird um Nachladeruckler und ewige Latenz zum Hauptspeicher zu umgehen. d.H die vielen daten werden garnicht benötigt sondern sollen nur latenzfrei zu Verfügung stehen.

Ergo behebt mehr Vram die Nachladeruckler bei einer 970 ohne sie effektiv langsamer zu machen.

Jetzt mal ganz grob ausgedrückt. Werden doppelt so viele Texturen pro Bild benötigt hast du natürlich recht dann braucht man nciht mehr Vram sondern mehr Bandbreite. Aber das sind zwei grundverschiedene Probleme.

Hoffe jetzt das war nicht zu grob ausgedrückt :)
 
Zuletzt bearbeitet:
jetzt müsst ihr mir das aber mal bei den anderen karten erklären mit doppelten speicher.
ich habe es so verstanden: auf grund der problematik der gtx970 bringt der doppelte speicher nichts!
würde ich aber eine gtx980 nehmen müsste es funzen oder wie?
wo ist der erklärbär wenn man ihn braucht?!
Das würde ich so nicht sagen: Die ersten 7 GB wären ja trotzdem mit 224 Bit ansprechbar, also 196 GB/s. Nur die hinteren 1 GB, die an diesem geteilten MC hängen, sind langsam.
 
das meine ich doch die ganze zeit! :lol:
es ist doch wumpe ob die karte 3,5gb hat und ein 224bit interface und ein hersteller 7 draus macht oder bei einer karte mit 256bit anstatt 4gb 8 drauf haut.
in sachen geschwindigkeit ändert sich doch fasst nichts?
 
jetzt müsst ihr mir das aber mal bei den anderen karten erklären mit doppelten speicher.
ich habe es so verstanden: auf grund der problematik der gtx970 bringt der doppelte speicher nichts!
würde ich aber eine gtx980 nehmen müsste es funzen oder wie?
wo ist der erklärbär wenn man ihn braucht?!

Die GTX 970 verhält sich dabei genau so wie die GTX 980. Nur das bei der 970 die 3,5GB+512MB zu 7GB+1GB werden. Bei der 980 sind es halt 4GB zu 8GB - wobei die Bandbreite bei der 980er auch bei ~224GB/ bleibt.

PS: Wie gesagt wir drehen uns alle im Kreis, aber jeder meinte wohl das gleiche - nur anders ausgedrückt :P
 
Naja ich verstehe halt nicht wo bei Maxwell das Problem liegen soll doppelte Vram Kapazität zu haben ? Selbst wenn wir davon ausgehen, das in hohen Auflösungen mehr/größere Texturen hin und her geschubst werden, Maxwell ist da sehr schmerzfrei und teilweise besser unterwegs als ein 384bit Tahiti :ka:
 
eben! die bandbreite ist doch die selbe. der doppelte speicher macht ja nicht gleich die karte langsam.
 
Das Problem habe ich schon verstanden ist ja mein Studiengebiet :D

Edit: Ich wollte nur nicht das wir aneinander Vorbei reden, da die Zeitkritische Komponente mit der Größe des Vrams erst einmal nichts zu tun hat.

Eine Textur hat jetzt 16Mib d.h bei 8 Speichersteinen für jeden 2MiB. Wird auf diese Textur Zugegriffen werden aus jedem Speicherstein diese 2MiB mit einem 32bit bus ausgelesen.
Da ist es erstmal egal ob der Speicher 2MiB oder 1024MiB groß ist es kommt auf das selbe raus.

Was du meinst ist, dass die Software für ein Frame statt 3GB -> 6GB benötigt und desshalb sich die FPS halbieren. Nun ist es aber so dass mehr Vram hauptsächlich benötigt wird um Nachladeruckler und ewige Latenz zum Hauptspeicher zu umgehen. d.H die vielen daten werden garnicht benötigt sondern sollen nur latenzfrei zu Verfügung stehen.

Ergo behebt mehr Vram die Nachladeruckler bei einer 970 ohne sie effektiv langsamer zu machen.

Jetzt mal ganz grob ausgedrückt. Werden doppelt so viele Texturen pro Bild benötigt hast du natürlich recht dann braucht man nciht mehr Vram sondern mehr Bandbreite. Aber das sind zwei grundverschiedene Probleme.

Hoffe jetzt das war nicht zu grob ausgedrückt :)

Ja so in etwa. Aber wenn du den Speicher verdoppelst, musst du auch überlegen was passiert wenn du ihn wirklich voll nutzt. Das ist ja das Ziel des ganzen.

Und wenn du die 8GB voll machst, wirst du mächtige Probleme bekommen. Technisch gesehen wird die VRAM-Problematik der 970 dabei um den Faktor 9 größer, und dann ist sie vermutlich kaum noch zu gebrauchen.
 
Naja ich verstehe halt nicht wo bei Maxwell das Problem liegen soll doppelte Vram Kapazität zu haben ? Selbst wenn wir davon ausgehen, das in hohen Auflösungen mehr Texturen hin und her geschubst werden, Maxwell ist da sehr schmerzfrei und teilweise besser unterwegs als ein 384bit Tahiti :ka:

Der Shader Cache von Maxwell dürfte bei größerem VRAM aber nicht mehr so effektiv sein.

Ja so in etwa. Aber wenn du den Speicher verdoppelst, musst du auch überlegen was passiert wenn du ihn wirklich voll nutzt. Das ist ja das Ziel des ganzen.

Und wenn du die 8GB voll machst, wirst du mächtige Probleme bekommen. Technisch gesehen wird die VRAM-Problematik der 970 dabei um den Faktor 9 größer, und dann ist sie vermutlich kaum noch zu gebrauchen.

Der erste Satz, das hätte alles hier erleichtert :P
 
Zurück