AMD Radeon RX 7000: Leaker spricht von vierfacher Rechenleistung

@SilentHunter: Die 6800 XT ist mit 20,7 TFlops FP32 spezifiziert.
Dieselbe Frage wurden die ... FP32 Tflops bei einfacher oder doppelter Genauigkeit angegeben?

Edit:
Quelle: AMD
Max. Leistung mit halber Genauigkeit (FP16) 46.08 TFLOPs 41.47 TFLOPs 32.33 TFLOPs
Max. Leistung mit einfacher Genauigkeit (FP32) 23.04 TFLOPs 20.74 TFLOPs 16.17 TFLOPs
 
Zuletzt bearbeitet:
Ist das eine Scherzfrage oder was meinst du damit? Was soll ein "FP32-Durchsatz mit doppelter Genauigkeit" sein?
(Gib mir einen Hinweis was du meinst und ich versuche dir eine hilfreiche Antwort zu geben. Als Tipp, von doppelter Genauigkeit spricht man bei der Verwendung von 64 Bit Fließkommadatentypen, gemeinhin vereinfachend als FP64 bezeichnet. Da schneidet auch RDNA2 und absehbar auch RDNA3 schlecht ab, weil diese Funktionalität zugunsten von einzusparender Siliziumfläche möglichst klein gehalten wird. Aktuell liegt das Verhältnis hier bei 1/16 (i. V. z. FP32) bei RDNA2, die RX 6800 XT erreicht also gerade mal 1,3 TFlops FP64 Peak-Durchsatz, sofern es das war, was du wissen wolltest.)
 
Zuletzt bearbeitet:
Wurde am Freitag benachrichtigt, dass mein Strompreis ab 1. Mai um 30 % steigt.
(750 Euro/Jahr)

Dabei bin ich noch gut dran, gibt auch Anbieter, die 50 % raufschmalzen.

Irgendwie schräg, wie sich PC-Gaming (global) entwickelt.
Es ist nicht das PC-Gaming per se das sich in den letzten Jahre schräg entwickelt. OK von den Hardwarepreisen mal abgesehen sind das die in den letzten Jahren sehr schnell und horrend gestiegenen Energiekosten in Deutschland . In einem Ausmaß wie in kaum einem anderen EU Land.

Bei meinem aktuellen Anbieter sind es 1,6Cent/KWh Aufschlag
 
Zuletzt bearbeitet:
Dieselbe Frage wurden die ... FP32 Tflops bei einfacher oder doppelter Genauigkeit angegeben?
Es steht doch extra FP32 da. Das heißt einfache Genauigkeit. Doppelte Genauigkeit wäre FP64.

6800XT:
1651429130206.png


5700XT:
1651429147038.png


Eine 6800XT ist in der ganzen theoretischen Rechenleistung bzw. jedem Hauptwert mehr als doppelt so schnell wie ne 5700XT. In der tatsächlichen Spieleleistung aber nicht (wobei dir Skalierung hier noch sehr gut ausfällt weil RDNA2 wesentlich besser ist als RDNA1). Genau darum gings ja ganz oben - das "Gegenbeispiel" 6800-5700 ist halt keins.
 
Zuletzt bearbeitet:
Eine 6800XT hat über 20 TFlops FP32, mehr als doppelt so viel wie ne 5700XT.

Ahh, sorry hab bei PCGH geschaut und bin dann noch in der Spalte verrutscht. Dennoch sagt PCGH hier 18,57 TF! AMD spricht tatsächlich von knapp über 20? Dafür ist allerdings auch die 5700XT etwas höher angesiedelt. In Summe wurde ich daher sagen, 100% mehr in der Theorie, 70% in der Praxis? OK?
 
Dennoch sagt PCGH hier 18,57 TF! AMD spricht tatsächlich von knapp über 20?
Es kommt drauf an ob man den Basistakt, den Gameboost, den Maxboost oder irgendwas dazwischen als Berechnungsgrundlage nimmt, deswegen weichen die Zahlen etwas voneinander ab.
In Summe wurde ich daher sagen, 100% mehr in der Theorie, 70% in der Praxis?
Kommt etwa hin, ja.
Wie gesagt die Skalierung ist hier ziemlich gut (im Bestcase wird sogar eher +80% in der Praxis erreicht), weil RDNA2 seine Einheiten deutlich besser auslasten kann als RDNA1 und noch nen zusätzlichen riesigen Cache hat. Üblicherweise kommste aber bei einer Verdoppelung der theoretischen Flops eher bei geschätzt ganz grob +50% Praxisleistung raus. Alles was drüber geht ist davon abhängig wie gut der Hersteller die neue GPU optimieren konnte. Das hat AMD bei RDNA1 auf 2 nicht zuletzt wegen der Cache-Idee deutlich besser hinbekommen als NVidia bei Turing zu Ampere. Man darf gespannt sein wies diesmal ausgeht.
 
Zuletzt bearbeitet:
Man muss schon sagen marketingtechnisch lässt man sich schon so einiges einfallen, denn den Unternehmen sind Leaker mehr zugetan als manche glauben möchten. Es wird ein Hype generiert der seine Vollendung in der Bauernfängerei findet und da die Informationen nicht von offizieler Seite stammen, müssen sie auch nicht zwangsläufig der Wahrheit entsprechen.Letztlich macht das jede Diskussion überflüssig und nichtig. Praise the lord.:hail::devil:
 
Ahh, sorry hab bei PCGH geschaut und bin dann noch in der Spalte verrutscht. Dennoch sagt PCGH hier 18,57 TF! AMD spricht tatsächlich von knapp über 20? Dafür ist allerdings auch die 5700XT etwas höher angesiedelt. In Summe wurde ich daher sagen, 100% mehr in der Theorie, 70% in der Praxis? OK?
Die Hersteller kommunizieren hier bzgl. der Specs alle einheitlich auf Basis des Peak-Taktes (bei AMD ist das der "Boost-Takt"), entsprechend ist 20,7 TFlops FP32 Peak-Durchsatz der einzig richtige Wert für die RX 6800 XT bei 2,25 GHz.
Konkrete Messungen der TFlops sind dagegen immer Workload-spezifisch und nicht über Programme hinweg vergleichbar (je nach Programm müssen gar die exakt gleichen Datensätze für eine Vergleichbarkeit verarbeitet werden).

@glatt_rasiert: Na selbstredend wird der eine oder andere Leaker auch mal direkt von einem Hersteller wie AMD gefüttert, was denn sonst. ;-) Das hält die Presse wach und sorgt für kostenlose Werbung nach Salamitaktikmanier. Selbst das Verteilen von falschen Gerüchten, solange sie dem Werbezweck und Im-Gespräch-bleiben dienen, darf man hier erwarten.
 
Wurde am Freitag benachrichtigt, dass mein Strompreis ab 1. Mai um 30 % steigt.
(750 Euro/Jahr)

Dabei bin ich noch gut dran, gibt auch Anbieter, die 50 % raufschmalzen.
Krass. Mein Strompreis ist im März nicht mal um 10% gestiegen. Zahle gerade mal rund 470 Euro/Jahr.
 
Ok bleiben 40% am Schluss übrig ? wer mehr erwartet ist sehr naiv
& enttäuscht steht schon automatisch fest.
 
Wen meinst du denn? Mich offensichtlich nicht, denn ich würde dir genau so Kontra geben wenn du haltlosen Unsinn über/zu AMD schreiben würdest, nur ...
a) wird das bei dir eher mit geringerer Wahrscheinlichkeit vorkommen, da du deine Präferenzen hier schon vielfach unmissverständlich klar gemacht hast (wenn es auch sicherlich noch weitaus extremer gepolte Gesellen als dich gibt ;-)).
b) müsste ich da in einen Thread in diesem Fall schon recht früh einsteigen, weil andernfalls schon die übliche Horde über dich hergefallen sein wird und es nun wirklich keinen Sinn mehr macht den gleichen falschen Sachverhalt zum hundertdrölfzigsten Male anzukreiden und zu korrigieren.

Aber schön zu wissen, dass du dir und deiner selektiven Wahrnehmung treu bleibst und geflissentlich alles andere, was ich so schreibe, ignorierst. Das hilft natürlich ein konsistentes Weltbild nach Schubladenmanier aufrecht zu erhalten. ;-)
So so my Friend und in so manchen Sachen "Gleichgesinnter".
Wenn das Thema "Schubadenmanier" und wohl ignorierende Beiträge schon erwähnst, drängt sich mir just der Verdacht auf, dass Du genau dies so angewendet hast, als ich meinen "Unmut" über die ach so tolle AMD 6500XT sowie den Termin vom Release der 5700X CPU geäußert habe. Aber so ist´s halt mit Scheuklappen, da gibt´s KEIN links oder rechts.
War schon immer so, und wird noch ne Weile so bleiben : Wenn der Bauer NICHT schwimmen kann, ist die BADEHOSE daran schuld.

p.s. viele Späße in Deiner Welt !! Und JA, ich habe selbiges in der Meinigen ... :-P

So long, Föhn. :-D
 
Zuletzt bearbeitet von einem Moderator:
Die klassischen Gerüchte und Spekulationen vor dem Release einer neuen Gen. Wie immer.
Nein, nicht wirklich!
Diese Generation hat eine seltsame Gerüchteküche. Ob das an den Spätfolgen der COVID-Krise liegt oder ob die Leaker einfach ins Blaue raten ... keiner weiß es!

Technisch steht so gut wie nichts fest außer angeblichen Specs, die die Leaker ebenfalls alle paar Monde neu auswürfeln. Man will ja im Gespräch bleiben. Jetzt wird halt zur Abwechslung mit TFlops jongliert. :klatsch:

4 fache Rechenleistung bei einen bestimmten Programm oder Aufgabe.
We knew it ;)
Ja, das ist die Magie von Clickbait! TFlops als Rechenleistung zu bezeichnen schöpft den Marketingrahmen gnadenlos aus.

Bei professionellen Karten und Serverclustern macht die Angabe von TFlops Sinn. Davon hat man als Spieler aber genau NULL. Am Ende werden sich wieder einige "Spezialisten" hier beschweren, die den Humbug mit vierfacher X-Leistung geglaubt haben.

Dann muss man jenen Uninformierten + Leichtgläubigen wieder Tag und Nacht verbal Realismus einprügeln.
 
Das dürften definitiv deutlich mehr werden. Nvidia macht einen Sprung von gut 2,5 Nodes, das gab es schon lange nicht mehr.
Dafür wird es aber auch alleine schon nur durch die massiv erhöhte Shaderanzahl ein sehr viel grösserer Chip werden, wenn es nach den bislang gehandelten Gerüchten geht. Da wird somit schon ein sehr grosser Teil vom Vorteil des verbesserten Fertigungsprozesses draufgehen.
 
Dafür wird es aber auch alleine schon nur durch die massiv erhöhte Shaderanzahl ein sehr viel grösserer Chip werden, wenn es nach den bislang gehandelten Gerüchten geht.
Der Chip wird genau so bei ungefähr 600 mm² landen wie der GA102. Alles darüber wird viel zu teuer für den Konsumer Markt und obendrein sinkt die Ausbeute was die Kosten noch weiter treibt.
 
ja einige haben bemerkt das die fp32 Angabe bei nvidia reines marketing bullsh ist

das liegt and er architktur von ampere sieht man sich die whitepaper an und dem sm Aufbau des ga100 und ga102
merkt man eines in ga102 werden die fp64 Einheiten nicht dargestellt sind aber da.
In eine Sm sind
64 int32 für Abwärtskompatibilität
64 fp32
24fp64
8 tensor cores
Das bedingt dann 88 fp32 Operationen pro Takt.
Die int32 mache hier mal NIX außer in legacy spielen mit dx9 und älter
Und ampere hat nicht mehr das Manko das nur einer der Bereechnungen laufen können sprich int32 oder fp32 das problem hatte turing
Turing hat auch fp64 Einheiten in den sm
Folglich Rechnen alle turing chips mit 64 fp32 pro sm
Darum ist eine rtx2070 ~ gleich schnell wie die rtx3060 oder 2304 vs reale 2464 nur ist bei turing der Takt höher 1,92ghz vs 1,85ghz
und dabei der chip von 445 auf 276mm² geschrumpft

Die angaben bei nvidia tflops bei ampee sind reines marketing und hat mit der realität nix zutun
Die angaben bei amd sind real obwohl diese erstmals seit 2007 wieder stimmen.
Den amd hat lange auf fp64 gesetzt mit software Ausgabe in fp32
das bedingte bis zu 40% fp32 Leistung pro cu und am ende bei vega bis zu 85% fp32 pro cu
RDNA ist ein reines fp32 design das auf spiele spezialisiert ist. Daher passt hier die fp32 perfekt.
ältere gen muss man gegenrechnen bis man den wahren fp32 Leistung erhält.

nvidia indes erst ab ampere
man könnte noch tesla (g80) noch einbinden den die sfu die gibt es noch heute die konnten 4 fach berechnen
Diese wurden ab tesla2 deaktiviert
Und erst bei kepler in doppelter Ausführung wieder in den sm aktiv liegen aber brach da sie nur für fp64 genutzt wird.
das ging bis turing so dann änderte nvidia die sm strukur
in 64 int32 64 fp32 16 tensor 8 fp64
Diese werden aber im Dokument nicht erwähnt man sieht es aber am diagramm das sfu vorhanden sind und diese deutlich kleiner sind
das lässt nur den Schluss zu 8 fp64 pro sm
Diese sind wie bei den Vorgängern auf fp64 only
Das änderte sich ab ampere

ampere tf vs pascal tf das erklärt sich so
bsp gtx1080ti vs rtx3060
3584*2*1,48=10,6
reale 2464*2*1,85=9,1tf
=16% differenz das passt nicht zu tpu Angabe von 7% das erklärt sich so

Die einzige unbekannt ist gdd6 vs gddr5x latenz
bsp
gddr5x übliche latenz von ddr3 cl11 =1,0ns 11gbs
gddr6 übliche latenz von ddr4 cl16=1,06ns 15gbs
Das könnt die Differenz erklären sagt aber auch das gddr5 nicht unbedingt mit gddr6 vergleichbar ist.
100/10,6*9,1/1*1,09=91% aber alles ab gddr6 ist vergleichbar.
Der Grund warum ich nicht die gbs genommen habe liegt daran das die latenz nicht banbreite ist
Den diese wird derzeit nicht ansatzweise genutzt. Erst ab 2160p wird diese zum Problem. Und da reicht die tf leistung der chips nicht mehr aus.
Derzeit limits bei Auflösung zu bandbreite sind
1080p etwa 200gb/s
1440p etwa 332gb/s
2160p etwa 800gb/s

Das wird sich ändern wenn die basis von 512bit pro texture auf 2mb kommen wird.
Da aber vrs bald standard wird ist der wert variable und kann dennoch für bessere texturen bei weniger bandbreite sorgen.
Darum erwarte ich keine hohen Steigerungen mehr bei Bandbreitenanforderungen in Auflösungen.
Womit 21gb/s vram völlig ausreichen werden für gpu bis 25tf
Damit sind die 24gbs und kommende 32gbs nur noch für high end gpu vom belang ab 40tf
Wenngleich auch die Auflösung drastisch steigen wird von derzeit 4k auf 8k
Den 40tf müssen auch von der cpu bedient werden.
CPu limits erwarte ich schon bei rdna3 und lovelace ab der unteren high end klasse
sprich rtx4080ti ~51tf / rx7900xt ~53tf

Klar wenn man die marketing angaben glaubt könne die fp32 werte deutlich von der Realität abweichen darum muss ma in den architekturen nach dem Grund suchen.
Den Mathe lügt nicht lediglich die annahmen können abweichen.
 
Perfekt, RX 6800XT und der 5900X weg, dann 7900XT und ein 7900X gekauft und dann kann ich mir auch endlich mal ohne Zettel merken was ich im Rechner habe. :lol:

Wenn die GPU´s und die CPU´s wirklich beide die 7000er Namensstruktur haben rüste ich auf jeden Fall auf, schon allein weil ich das so Wirklich witzig finde mit den Bezeichnungen dann.
 
ja einige haben bemerkt das die fp32 Angabe bei nvidia reines marketing bullsh ist
War es das nicht schon immer der Fall?
Beim Lotto würde man sagen: "ohne Gewähr"

Irgendwann ist man entweder für die Profis Richtung fp64 Double-Precision und beim Spielen auf fp8/fp16 mixed-precision übergegangen. Inzwischen blickt kein Mensch mehr durch. Für Privatanwender eigentlich eine nutzlose Angabe!

Es handel sich um rein theoretische Werte, die nichts mit der Wirklichkeit zu tun haben. Vergleichen kann man die TFlops zwischen den Architekturen auch nicht.

Die angaben bei nvidia tflops bei ampee sind reines marketing und hat mit der realität nix zutun
Die angaben bei amd sind real obwohl diese erstmals seit 2007 wieder stimmen.
AMD hat ebenfalls über die Jahr geschwindelt. Das gehört in der Branche leider fast zum guten Ton.

Die Radeons hatten einmal viel fp64 / compute verbaut. Das wurde im Laufe der Jahre abgebaut und AMD hat die Entwicklung wieder in professionelle und spielerische Architektur aufgetrennt.

Den 40tf müssen auch von der cpu bedient werden.
CPu limits erwarte ich schon bei rdna3 und lovelace ab der unteren high end klasse
sprich rtx4080ti ~51tf / rx7900xt ~53tf
Ich denke genau das Gegenteil ist der Fall!

Die CPU wird in Zukunft eher entlastet werden, weil die künftigen Architekturen alles viel mehr intern in der GPU-Infrastruktur regeln. Es gilt das Motto so wenig wie möglich über CPU und alles über riesige interne Caches, VRAM, SSD/Nvme, schnelle Busse und Co-Prozessoren berechnen und streamen.

CPU-Limits sollten ironischerweise nur in unteren Auflösungen ein Problem sein. Es würde mich daher nicht wundern, wenn künftig Downsampling eine Methode wird um die CPU zu schonen und gleichzeitig bessere Bildqualität erhältlich wäre.

Ausnahmen sehe ich bei Simulationen und Strategiespielen, also jedes Szenario bei dem viele Objekte oder Einheiten im Bild wuseln. Alles andere regeln Mesh-Shader / Meshlets und ähnliche Techniken "faken".

Mich interessiert auch, ob die versprochene Symbiose zwischen Sampler Feedback und DirectStorage in Zukunft als Entlastungsmaßnahme eingesetzt wird oder nur reines Marketing war.
 
Zurück