Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

Das ist eine Designentscheidung von Nvidia.
Denn GP100 kann es in full speed. (alles weitere dazu weiter unten)
Somit ist es ein AMD-only, sogar Vega-only, Feature. Mehr sage ich nicht.

Wenn ich das white paper im Kopf hab, beherrscht GCN zwar 4 bit Zahlen, nur schau ich da grad wohl zu sehr aus dem Blickwinkel meiner Arbeit drauf, um zu verstehen, was Du mir sagen willst.
Du kannst FP-Zahlen beliebig verkleinern, das Problem ist nur, dass es keinerlei Performancevorteil bietet, weil auf FP16 oder FP32 aufgerundet wird.

Nein. ich trolle nie bewusst.
Dann hast du also keine Ahnung. Auch gut.

Inwiefern muss ich hier was belegen?
Performt irgendeine Karte von Nvidia schlechter, als sie es sollte?
Nun, du hast etwas behauptet. Und wenn ma netwas behauptet, dann sollte man es belegen. Sonst bleibt es eben nur eine Behauptung.

Ich kann in dem Benchmark keine Karte finden, die unter ihrer theoretischen Leistung bleibt:
Und was soll das belegen?

Angenommen bei Wolfenstein2 hätte man sich die Biegen und Brechen Optimierung auf die 0,1% Vegakarten mit FP16 und ShaderIntrinics gespart und dafür die Zeit in die Optimierung der Pascalarchitektur gesteckt. Vielleicht wären die Pascalkarten dann 10, 20 oder gar 30% schneller?

Also kurz: Du hast noch nichts belegt. Wolfenstein2 wurde mit Biegen und Brechen auf Vega optimiert und trotzdem sind die Ergebnisse ziemlich mager, wie du ja nochmal belegt hast mit deinem Link.
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

Somit ist es ein AMD-only, sogar Vega-only, Feature. Mehr sage ich nicht.


Du kannst FP-Zahlen beliebig verkleinern, das Problem ist nur, dass es keinerlei Performancevorteil bietet, weil auf FP16 oder FP32 aufgerundet wird.


Dann hast du also keine Ahnung. Auch gut.


Nun, du hast etwas behauptet. Und wenn ma netwas behauptet, dann sollte man es belegen. Sonst bleibt es eben nur eine Behauptung.


Und was soll das belegen?

Angenommen bei Wolfenstein2 hätte man sich die Biegen und Brechen Optimierung auf die 0,1% Vegakarten mit FP16 und ShaderIntrinics gespart und dafür die Zeit in die Optimierung der Pascalarchitektur gesteckt. Vielleicht wären die Pascalkarten dann 10, 20 oder gar 30% schneller?

Also kurz: Du hast noch nichts belegt. Wolfenstein2 wurde mit Biegen und Brechen auf Vega optimiert und trotzdem sind die Ergebnisse ziemlich mager, wie du ja nochmal belegt hast mit deinem Link.

1) Du müsstest erst mal belegen, dass die FP16 Berechnungen in Wolfenstein 2 wirklich doppelt so schnell erfolgen, wie FP32. Je nachdem bremst eventuell einfach die Engine, oder die API. und FP16 mit Geschwindigkeit von FP32 kann Pascal auch. Damit ist es halt kein Vega only Feature.
2) Bei 4 bit fehlen dir die nötigen bits, um eben ein float zu einem float zu machen. Hier hätte ich nun gern mal ein Beispiel deinerseits (siehe "Behauptung" und so). Selbst ein Minifloat besteht aus 8 bit, nur um alle nötigen Informationen zu enthalten.
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

1) Du müsstest erst mal belegen, dass die FP16 Berechnungen in Wolfenstein 2 wirklich doppelt so schnell erfolgen, wie FP32. Je nachdem bremst eventuell einfach die Engine, oder die API. und FP16 mit Geschwindigkeit von FP32 kann Pascal auch. Damit ist es halt kein Vega only Feature.
:lol:

Bitte was?

Natürlich erfolgen die FP16-Berechnungen in Wolfenstein2 auf Vega doppelt so schnell, sonst ergibt das Feature doch gar keinen Sinn, davon rede ich doch die ganze Zeit :lol:

2) Bei 4 bit fehlen dir die nötigen bits, um eben ein float zu einem float zu machen. Hier hätte ich nun gern mal ein Beispiel deinerseits (siehe "Behauptung" und so). Selbst ein Minifloat besteht aus 8 bit, nur um alle nötigen Informationen zu enthalten.
Soviel wieder zum Thema Ahnung: Es gibt auch minifloats mit weniger als 8 bit.

PS: Die Belege für deine behauptete Pascal-Optimierung kommen wann?
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

Was soll daran jetzt spannend sein? Der starke Anstieg der Skylake iGPU? Das inzwischen mehr Teilnehmer die 64 bit Version des Browsers nutzen? Oder das die Verbreitung von Flash kontinuierlich zurück geht? (was tatsächlich eine gute Sache ist)

Nein.
Spannend ist eher die unterschiedliche Bezugsgröße.
Das Steam Survey ist halt leider nicht sonderlich verlässlich.
Die Teilnehmerzahl und vor allem die befragten Nutzer ändern sich immer wieder.
Auf meinem Laptop wurde ich nach der Windows 10 Installation bisher ein Mal befragt - Das Ding ist jetzt fast 5 Jahre alt und hat eine einzige Steam Umfrage miterlebt.
Meine beiden anderen Rechner haben bisher je zweimal dran teilgenommen - aber nicht beide unter den gleichen Umständen.
Ich halte die Hardware der beiden Rechner ziemlich gleich, was mir Kopfschmerzen und Ärger mit der Frau erspart^^.
Dennoch wurden beide ein Mal vor der letzten Hardwareänderung befragt (kurz nach dem Kauf 2009) und einer gleich danach (noch mit Windows 7).
Mein eigener Rechner wurde erst nach Neuinstallation von Windows 10 (nicht nach dem Upgrade) nochmal zum Survey gebeten.

Diese ständig wechselnden Umstände des Surveys und die freiwillige Teilnahme führen zu nicht grad verlässlichen Daten.

Auch wenn ich WCCFTech nur ungern verlinke, haben sie aktuell eine schöne Gegenüberstellung der Zahlen zur Hand:

Firefox Hardware Survey Puts AMD Ahead Of NVIDIA In Terms Of GPU Market Share

The GPU market share as reported by Firefox are as follows:

Intel’s integrated GPUs leading at a solid 65.39%.
AMD GPUs following at 15.40%
NVIDIA GPUs close behind at 14.167%
To put this into contrast, the latest October 2017 Steam hardware survey reports the following metrics:

NVIDIA GPUs at 81.4%
AMD GPUs much further behind at 10.84%
Intel iGPUs in the last at 7.54%

Kaaruzo sagt es schon ganz richtig:
Naja, da wird ja nur die gesamte Anzahl aller GPUs gezeigt. Dank seiner IGPUs führt Intel logischerweise.

Wenn man aber die rein dezidierten GPUs anschaut, dann führt Nvidia solide mit 70% zu 30% und das schon länger.

Why AMD Gained Market Share In Discrete GPUs In Q2.

Lange Rede, kurzer Sinn: Es ist schön, eine zweite, etwas verlässlichere Quelle für solche Statistiken zu haben.
Dazu passt sie auch noch recht gut zu den Zahlen, die sonst verfügbar sind (siehe Kaaruzos Link)
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

:lol:

Bitte was?

Natürlich erfolgen die FP16-Berechnungen in Wolfenstein2 auf Vega doppelt so schnell, sonst ergibt das Feature doch gar keinen Sinn, davon rede ich doch die ganze Zeit :lol:
Dass etwas implementiert ist, bedeutet nicht, dass es wie gewünscht funktioniert.
Es wäre dem Studio zu wünschen, aber es gibt genügend Möglichkeiten für Flaschenhälse, dass es schwer zu prüfen ist.

Soviel wieder zum Thema Ahnung: Es gibt auch minifloats mit weniger als 8 bit.

Na, dann her damit, ich lausche.

PS: Die Belege für deine behauptete Pascal-Optimierung kommen wann?

Sobald Du mir Belege für deine Behauptungen liefern kannst - besonders die zur Geschwindigkeit der FP16 Berechnung fände ich spannend.
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

Dass etwas implementiert ist, bedeutet nicht, dass es wie gewünscht funktioniert.
Es wäre dem Studio zu wünschen, aber es gibt genügend Möglichkeiten für Flaschenhälse, dass es schwer zu prüfen ist.
:lol:

Wir sind bei dem Punkt angekommen, wo es endgültig lächerlich ist :)

Na, dann her damit, ich lausche.
Bitte:
Minifloat – Wikipedia

Siehst du? So geht das: Behauptung -> Beleg. :daumen:

Sobald Du mir Belege für deine Behauptungen liefern kannst - besonders die zur Geschwindigkeit der FP16 Berechnung fände ich spannend.
Auch hier gern:
AMDs "Rapid Packed Math" Vega-Feature ermoglicht FP16-Berechnungen mit doppelter Performance | 3DCenter.org
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

:lol:

Wir sind bei dem Punkt angekommen, wo es endgültig lächerlich ist :)


Bitte:
Minifloat – Wikipedia

Siehst du? So geht das: Behauptung -> Beleg. :daumen:
In dem Fall haben wir an einander vorbei geredet.
Wie du in deinem eigenen Link zu Wikipedia sehen kannst, brauchst Du mehr als 4 bits für eine FP4 Zahl.
Ich hab dabei immer alle bits gezählt und eben mit Vorzeichen und Exponent gezählt.



Ähm.. das ist nur ein Beleg dafür, dass sie unter Umständen doppelt so schnell laufen.
Und genau das folgende aus dem 3DCenter Artikel habe ich ja auch schon gesagt:
"Und zweitens bedeutet selbst eine doppelt so schnelle Shader-Ausführung natürlich keine doppelten fps – da gibt es vorher und nachher schließlich noch andere Rechenschritte zu bewältigen, welche auch mit "Rapid Packed Math" nur genauso schnell laufen wie ohn"
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

In dem Fall haben wir an einander vorbei geredet.
Wie du in deinem eigenen Link zu Wikipedia sehen kannst, brauchst Du mehr als 4 bits für eine FP4 Zahl.
Ich hab dabei immer alle bits gezählt und eben mit Vorzeichen und Exponent gezählt.
Du solltest nochmal den Verlauf der Diskussion nachlesen, den hast du offensichtlich nicht verstanden. Mir ging es darum, dass "Support für FP16" etwas anderes ist als "FP16-Berechnungen sind schneller als FP32". Daher mein Vergleich mit noch kleineren FP-Zahlen. Vega z.B. würde von FP8 genauso wenig profitieren, wie alle anderen Grafikchips. Darauf zielte meine Aussage hin ab.

Ähm.. das ist nur ein Beleg dafür, dass sie unter Umständen doppelt so schnell laufen.
Nö, FP16-Berechnungen laufen bei Vega IMMER doppelt so schnell ab, wie FP32. Daher nennt man das auch FullSpeed.

Und genau das folgende aus dem 3DCenter Artikel habe ich ja auch schon gesagt:
"Und zweitens bedeutet selbst eine doppelt so schnelle Shader-Ausführung natürlich keine doppelten fps – da gibt es vorher und nachher schließlich noch andere Rechenschritte zu bewältigen, welche auch mit "Rapid Packed Math" nur genauso schnell laufen wie ohn"
Auch dies war leider überhaupt gar nicht Teil der Diskussion.

Fakt ist: Wolfenstein2 enthält mit FP16 und ShaderIntrinsics zwei AMD und sogar Vega-exklusive Features, die sonst keine andere Karten nutzen kann. Das nennt man Optimierung auf Biegen und Brechen. In Anbetracht der Marktanteile sind diese Optimierung sicherlich alles Andere als lohnenswert unterm Strich, d.h. hätte man die Zeit, die die Implementierung dieser Features gekostet hat, in die allgemeine DX-Optimierung gesteckt, wäre damit mehr Usern geholfen.

Deine Belege für die Pascal-Optimierung kommen noch, hoffe ich?
 
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

Versehentlich Doppelt abgespeichert... Bitte Entfernen

Danke
 
Zuletzt bearbeitet:
AW: Nvidia Geforce: Angeblich Ampere statt Volta für Spieler

Ich bin auf jeden Fall gespannt was die Karte so auf die Strasse bringt...

Neue Architektur/Fertigung/Speicher, also alles unter 50% Zuwachs, würde ich als grosse Enttäuschung ansehen.

20 - 30% würde Pascal sicher auch bringen, mit neuer Fertigung und GDR6.



Gesendet von meinem SM-G935F mit Tapatalk

Das ging zu Geforce GTS und Geforce 2 auch da war ATI damit beschäftigt Open GL mit ihren Karten zum laufen zu bringen .
Da gab es keinen großen Konkurenten zu Nvidia die TNT und TNT2 waren die Platzhirsche ,wie heute die xx80 und titan .
Duhast damals für 300 - 400 € die Top Karten bekommen . Und die Performancezuwächse waren bei 70 - 100 %.
Und erst die 9000er ATI Serie brauchte externe Stromanschlüsse.

Wow, mit Ampere kann man dann ganz locker 4k 120Hz zocken. Ein Traum wird wahr :banane:

Wenn mit Volta überhaupt eine Nennenswerte (bezahlbare) Leistungsteigerung (Leitsung/Pro Chipfläche) möglich gewesen wäre, schließlich hat Nvidia CEO Jen-Hsun Huang noch vor zwei Monaten selbst im Interview verlauten lassen dass Pascal "2017" für Gamer unschlagbar sein werde.
Dazu passt sehr gut das nun ein neuerer verbesserter Fertigungsprozess verwendet werden soll, wobei auch der neue 12 nm FinFet Fertigungsprozess im Grunde nur ein ferbesserter 16 nm FF+- Prozess darstellt und der Name "12 nm FinFet Fertigung" nur Martketingtechnisch gewählt wurde,
ausserdem passt dazu das nebenbei in den Leaks von GDDR6 die Rede ist und somit auch der Speicher zu den künftigen Leistungszuwächsen seinen Beitrag leisten wird.
Ich vermute stark das nun die Zeit, in der ein neuer Fertigungsprozess allein 30% mehr Perfomance brachte vorüber ist bzw. eine kleine Pause einlegt, das beste Beispiel das der Fertigungsprozess nicht allein für Leistung ausschlagebend sein kann liefert hier AMD's (Vega) GCN Gen 5 Architektur, die mmerhin im gegensatz zum Fji-Chip (GCN Gen 3) im halb so großen Prozess (28nm v.s. 14nm) gefertigt wird und kaum mehr Leistung bietet (sollte die Perfomance von Vega nicht doch noch stark zu nehmen).
 
Zurück