News DeepSeek: Geforce RTX 5090 schlägt Radeon RX 7900 XTX

Klarer kann man es, historisch betrachtet, kaum ausdrücken.
Zitat Scholz, Olaf: We have freedom of speech in Europe and in Germany. (...) what we do not accept is if this is supporting extreme right positions.

Man kann nur auf China setzen, die sind wenigstens nicht verrückt.
Herr Scholz bezieht sich damit auf Sir Karl Popper und dessen Formulierungen zum Toleranz-Paradoxon:
Eine universelle Toleranz lehnte Popper daher ab: „Weniger bekannt ist das Paradoxon der Toleranz: Uneingeschränkte Toleranz führt mit Notwendigkeit zum Verschwinden der Toleranz. Denn wenn wir die uneingeschränkte Toleranz sogar auf die Intoleranten ausdehnen, wenn wir nicht bereit sind, eine tolerante Gesellschaftsordnung gegen die Angriffe der Intoleranz zu verteidigen, dann werden die Toleranten vernichtet werden und die Toleranz mit ihnen.“

Oder einfach: Keine Toleranz der Intoleranz.
 
Zuletzt bearbeitet:
Nvidia sieht sein aktuelles Blackwell-Spitzenmodell, die Geforce RTX 5090, bei der KI-Beschleunigung des DeepSeek-LLMs in hauseigenen Benchmarks gegenüber der AMD Radeon RX 7900 XTX deutlich im Vorteil.
Das ist aber jetzt nicht überraschend, oder? Der Vergleich hinkt sowieso. Und zwar gewaltig. Es ist auch in keiner Weise fair, eine Vorgänger-Generation mit der letzten Generation zu vergleichen. Aber da werden die Fanboys sicher sagen, das AMD selber schuld ist. In Teilen mag das sein. Aber wenn jemand eine Grafikkarte für LLM kauft und dabei einen fairen Deal haben will, dann sieht NVidia weder in der jetzigen noch in der Vorgängergeneration wirklich gut aus. Es sei denn, Geld spielt eh keine Rolle

Ich drehe den Spiess mal um:
Die konkreten Token/s pro Grafikkarte haben sie ja nicht gesagt. Deshalb hier eine Schätzung:
Deepseek-R1:8b
RX7900XTXSchätzung anhand Diagramm98 Token/s
RTX4090+46%145 Token/s
RTX5090+106%202 Token/s

Auch wenn das nicht ganz präzise sein dürfte, kann wohl keiner behaupten, dass ich da eine Karte benachteilige.

02.02.2025, 15.32 Uhr:
ModellMomentaner Preis (Geizhals)€ pro Token/s
RTX50905499 €27.22 €
RTX40902990 €20.68 €
RT7900XTX899 €9.17 €

Ganz egal, ob wir uns jetzt über die momentan unverschämten Preise der RTX5090 unterhalten und uns einig sind, dass sie sicher noch billiger werden (was objektiv gesehen auch nicht so sicher ist, wenn ich die Preise der 4090 anschaue): auch die 4090 hat in der Preis / Leistung schlicht kein Land gegen die RX7900XT. Die 4090 müsste um die 1'330 € kosten. Die 5090 müsste so um die 1850 € kosten. Dann wären sie in etwa am gleichen Ort.
Aber die AMD Karten kommen sicher auch noch ins Rutschen und es ist durchaus realistisch, dass sie schon bald für deutlich unter 800 € zu haben sind, weil im Gegensatz zu NVidia muss AMD ihre Lager wirklich mal ganz klassisch für die Neuen leer kriegen. Das hat sich bei der Vorgeneration ja auch gezeigt. Die RX6950XT wurde einem am Schluss ja quasi nachgeschmissen. Jeder, der damals so eine Karte gekauft hat, hat auch jetzt, je nachdem, was er damit macht, nur wenig zu gewinnen, wenn er eine neue kauft. Wenn die Gerüchte wahr sind, dass die RX9070XT im Bereich der AI Cores zum Vorgänger an Performance zugelegt haben (bei allem Respekt will ich das auch noch erst sehen, weil das wäre eine Überraschung, mit der NVidia definitiv nicht rechnet...), dann ist dieser Vergleich im Moment eh nur ein Ablenkungsmanöver von NVidia, damit die Kunden ja nicht auf die Idee kommen, sich noch schnell eine RX7900XTX zuzulegen, wenn der Preis im Bereich einer RTX4070 Super ist. Wer das nicht glaubt: Die RX6950XT war am Schluss dort. Hatte aber "nur" 16 GB VRAM (was auch mein persönlicher "Hint" ist, wenn man sich eine Graka für LLMs zulegen will...)
 
Nein, auch offline. Zwar nicht ganz so vollumfänglich wie in der Online-Variante, aber zensiert wird auch offline. Denn:
DeepSeek ist Open Source! Und alle betreiben Zensur und Propaganda. Die beste Propaganda ist die, die man nicht merkt.
DeepSeek ist nicht wirklich Open Source.
Die Sprachmodell-Daten werden zwar kostenfrei zur Verfügung gestellt, rein schauen kann man da aber nicht.
Man kann nicht nachvollziehen, wo die Trainingsdaten kommen, was sie beinhalten und wie der Inhalt zu Stande gekommen ist.

In der Offline-Version wird dir nicht die Verbindung gekappt, wenn du nach in China unerwünschten Themen fragst sondern bekommst allgemein gehaltene Antworten. Zu wirklich China-Kritischen Themen hat das Sprachmodell dann aber keine Daten und kann schlicht nicht antworten.
 
Wollte ich auch eben schreiben :D einfach nur lächerlich von Nvidia. 5000er Serie ist einfach entäuschend.

Ich hoffe sehr, dass AMD in Punkto Preis & Verfügbarkeit jetzt einen draufsetzt :) ich schiele auf die 9060 XT
"Draufsetzen" in dieser Generation noch nicht.
Ich vermute eher "Topleistung der vorherigen Generation zum Mittelklassepreis", plus Verbesserungen/Strategiewandel bei Raytracing und Upsampling.

"Einen drauf" kommt erst mit der nächsten Generation.
 
Zuletzt bearbeitet:
Ehrlich jetzt das ist die News?
Wie konnte die 7900XTX nur langsamer sein, wo die Karte doch nur 2 Jahre älter ist als eine 5090 und schon damals schlechtere KI Einheiten hatte als ein 4090.
Die ClickBaite News Kacke nervt langsam echt.

PCGH macht ordentliche News oder lasst es einfach. Ein gutes Niveau und Leser erreicht man nicht mit Masse, sondern mit Qualität!
 
Ich habe mit der dist. 14b genau die Fragen aus diesem Artikel eingeben und sehr ausführliche Antworten bekommen.

Typischer Tagesschau Artikel. Man erfährt nur 40% der Wahrheit. Dann wird irgendein "Experte" zitiert der im Prinzip das sagt, was die Tagesschau möchte, wie der Artikel auf den Leser wirken soll.


Die Sprachmodell-Daten werden zwar kostenfrei zur Verfügung gestellt, rein schauen kann man da aber nicht.
Man kann nicht nachvollziehen, wo die Trainingsdaten kommen, was sie beinhalten und wie der Inhalt zu Stande gekommen ist.

In der Offline-Version wird dir nicht die Verbindung gekappt, wenn du nach in China unerwünschten Themen fragst sondern bekommst allgemein gehaltene Antworten. Zu wirklich China-Kritischen Themen hat das Sprachmodell dann aber keine Daten und kann schlicht nicht antworten.

Siehe oben. Ich hab es ausprobiert. Es kann sehr wohl beantworten und es hat auch extra erwähnt wie kritisch das mit den Studentenprotesten aus verschiedenen Augen gesehen wird.

Auch weiß man zum Großteil wo die Trainingsdaten herkommen. Nämlich von Chat-GPT.
Deswegen hat OpenAI auch rumgeheult.

Und wenn man so eine Ki mit solchen riesiegen Daten wie von ChatGPT füttert, ist es wirklich schwer da im Nachhinein noch etwas rauszueditieren. Das kannst du gar nicht komplett kontrollieren.
Denn wenn du genau deine Ki möchtest, die nur das kann was du möchtest, musst du sie mit deinen eigenen Daten füttern und das haben sie nicht gemacht.
Also selbst wenn Sie danach die Ki mit der chinesischen Sicht gefüttert haben, bringst du die Chat-GPT Daten nicht mehr unter Kontrolle.

Bei Chat-GPT hingegen wurden über Jahre Leute bezahlt die Ki anzulernen. D. h. das war viel mehr Vorarbeit aber hier konnte auch deutlich mehr gesteuert werden.

Aus diesem Grund kann man es auch so sehen: in den Daten von Chat-GPT, llama ect. wurde deutlich mehr Kontrolle ausgeübt als auf Deepseek-R1.
Letztendlich übernimmt Deepseek hauptsächlich die "Zensur" von Chat-GPT, weil es aus deren Datenpool genommen hat.

Das online Portal von deepseek ist zensiert aber bei der Ki selbst kann man das nicht sagen.
 
Was hat KI/AI mit Gamerkarten oder der schlechten Verfügbarkeit der 5000er zu tun? Die hohen Preise kommen m.E. durch die schlechte Verfügbarkeit zum Marktstart und Scalper und diese Bot-Geschichte.
 
Ah. Ein 170 SM/CU-Chip gewinnt gegen einen viel kleineren 96SM/CU-Chip.

Auch wenn es spezifisch die KI-Fähigkeiten betrifft... Wo ist die News? Dass die Radeon das bessere P/L bietet? Dann wäre das als Schlagzeile würdiger gewesen.
 
Ich habe mit der dist. 14b genau die Fragen aus diesem Artikel eingeben und sehr ausführliche Antworten bekommen.

Typischer Tagesschau Artikel. Man erfährt nur 40% der Wahrheit. Dann wird irgendein "Experte" zitiert der im Prinzip das sagt, was die Tagesschau möchte, wie der Artikel auf den Leser wirken soll.




Siehe oben. Ich hab es ausprobiert. Es kann sehr wohl beantworten und es hat auch extra erwähnt wie kritisch das mit den Studentenprotesten aus verschiedenen Augen gesehen wird.

Auch weiß man zum Großteil wo die Trainingsdaten herkommen. Nämlich von Chat-GPT.
Deswegen hat OpenAI auch rumgeheult.

Und wenn man so eine Ki mit solchen riesiegen Daten wie von ChatGPT füttert, ist es wirklich schwer da im Nachhinein noch etwas rauszueditieren. Das kannst du gar nicht komplett kontrollieren.
Denn wenn du genau deine Ki möchtest, die nur das kann was du möchtest, musst du sie mit deinen eigenen Daten füttern und das haben sie nicht gemacht.
Also selbst wenn Sie danach die Ki mit der chinesischen Sicht gefüttert haben, bringst du die Chat-GPT Daten nicht mehr unter Kontrolle.

Bei Chat-GPT hingegen wurden über Jahre Leute bezahlt die Ki anzulernen. D. h. das war viel mehr Vorarbeit aber hier konnte auch deutlich mehr gesteuert werden.

Aus diesem Grund kann man es auch so sehen: in den Daten von Chat-GPT, llama ect. wurde deutlich mehr Kontrolle ausgeübt als auf Deepseek-R1.
Letztendlich übernimmt Deepseek hauptsächlich die "Zensur" von Chat-GPT, weil es aus deren Datenpool genommen hat.

Das online Portal von deepseek ist zensiert aber bei der Ki selbst kann man das nicht sagen.
Die einzige Frage in dem Artikel ist, "Nutzt Peking DeepSeek für seine Zwecke?". Hast du das bei DeepSeek eingegeben?

Und offline ist gut? Kann es Kritik an der Kommunistischen Partei Chinas äußern? Machst du dir Gedanken um deine Daten, wenn du DeepSeek bittest, dir ein Winnie Puuh/Xi-Meme zu erstellen?
 
Ich habe mit der dist. 14b genau die Fragen aus diesem Artikel eingeben und sehr ausführliche Antworten bekommen.

Typischer Tagesschau Artikel. Man erfährt nur 40% der Wahrheit. Dann wird irgendein "Experte" zitiert der im Prinzip das sagt, was die Tagesschau möchte, wie der Artikel auf den Leser wirken soll.




Siehe oben. Ich hab es ausprobiert. Es kann sehr wohl beantworten und es hat auch extra erwähnt wie kritisch das mit den Studentenprotesten aus verschiedenen Augen gesehen wird.

Auch weiß man zum Großteil wo die Trainingsdaten herkommen. Nämlich von Chat-GPT.
Deswegen hat OpenAI auch rumgeheult.

Und wenn man so eine Ki mit solchen riesiegen Daten wie von ChatGPT füttert, ist es wirklich schwer da im Nachhinein noch etwas rauszueditieren. Das kannst du gar nicht komplett kontrollieren.
Denn wenn du genau deine Ki möchtest, die nur das kann was du möchtest, musst du sie mit deinen eigenen Daten füttern und das haben sie nicht gemacht.
Also selbst wenn Sie danach die Ki mit der chinesischen Sicht gefüttert haben, bringst du die Chat-GPT Daten nicht mehr unter Kontrolle.

Bei Chat-GPT hingegen wurden über Jahre Leute bezahlt die Ki anzulernen. D. h. das war viel mehr Vorarbeit aber hier konnte auch deutlich mehr gesteuert werden.

Aus diesem Grund kann man es auch so sehen: in den Daten von Chat-GPT, llama ect. wurde deutlich mehr Kontrolle ausgeübt als auf Deepseek-R1.
Letztendlich übernimmt Deepseek hauptsächlich die "Zensur" von Chat-GPT, weil es aus deren Datenpool genommen hat.

Das online Portal von deepseek ist zensiert aber bei der Ki selbst kann man das nicht sagen.
Ich habe bei der Arbeit das 671b mal laufen lassen. Ohne GPU, aber mit 256Cores und 1TB Ram, bricht keine Geschwindigkeitsrekorde, ist aber nutzbar. Beim herumspielen haben wir dabei teilweise, sagen wir mal, sehr merkwürdige oder generische Antworten bekommen, wenn es um Themen wie "Unterdrückung der Bevölkerung", "Arbeitsbedienungen", den Umgang mit den Uiguren und den Beziehungen zwischen China und Tibet / Taiwan ging.

Ich bin mir daher ziemlich sicher, dass sie hier und da zumindest dran herumgefummelt haben.
Natürlich kann niemand bestimmte Bereiche/Themen komplett "verschwinden" lassen, aber teilweise dran drehen oder mit widersprüchlichen Informationen füttern geht schon.

Aber ja, wenn die Quelle vergiftet ist, braucht man sich über das tote Vieh nicht wundern.

Was hat KI/AI mit Gamerkarten oder der schlechten Verfügbarkeit der 5000er zu tun? Die hohen Preise kommen m.E. durch die schlechte Verfügbarkeit zum Marktstart und Scalper und diese Bot-Geschichte.

Weil man AI auch wunderbar auf Gaming-Grafikkarten rechnen lassen kann.
Dedizierte AI-Beschleuniger kosten mehrere zehntausend Euro und unterliegen Export-Beschränkungen.
Für "kleinere" Unternehmen oder dort, wo spezielle Hardware halt nicht verfügbar ist, werden teilweise mehrere hundert Gamer-Grafikkarten in Server gesteckt. Die Karten fehlen dann halt zusätzlich zu der künstlichen verknappung durch Nvidia.

Die einzige Frage in dem Artikel ist, "Nutzt Peking DeepSeek für seine Zwecke?". Hast du das bei DeepSeek eingegeben?

Und offline ist gut? Kann es Kritik an der Kommunistischen Partei Chinas äußern? Machst du dir Gedanken um deine Daten, wenn du DeepSeek bittest, dir ein Winnie Puuh/Xi-Meme zu erstellen?
"Nutzt Peking DeepSeek für seine Zwecke?" und nach einem "Winnie Puuh"-Meme habe zumindest ich nicht gefragt.
Aber ja, vollständig offline funktioniert ansonsten gut! Zur Kommunistischen Partei rattert er (zumindest mir) allerdings nur die nüchternen Fakten herunter.
 
Die einzige Frage in dem Artikel ist, "Nutzt Peking DeepSeek für seine Zwecke?". Hast du das bei DeepSeek eingegeben?

Und offline ist gut? Kann es Kritik an der Kommunistischen Partei Chinas äußern? Machst du dir Gedanken um deine Daten, wenn du DeepSeek bittest, dir ein Winnie Puuh/Xi-Meme zu erstellen?
Ne die haben doch im Artikel gefragt wer der Staatschef ist und was bei den Studentenaufständen los war.

Wir können ja gern gemeinsam was testen. Schreib mir was ich eingeben soll und ich poste dir die Antwort.

Ja offline ist gut.
Es ist nicht nur offline, es hat auch keinen Zugang zum Internet.
Also braucht man keine Angst um Daten zu haben.
Ich bin mir daher ziemlich sicher, dass sie hier und da zumindest dran herumgefummelt haben.
Ja das glaub ich auch. Zumindest haben sie es versucht so gut sie es konnten.
 
Ne die haben doch im Artikel gefragt wer der Staatschef ist und was bei den Studentenaufständen los war.

Wir können ja gern gemeinsam was testen. Schreib mir was ich eingeben soll und ich poste dir die Antwort.

Ja offline ist gut.
Es ist nicht nur offline, es hat auch keinen Zugang zum Internet.
Also braucht man keine Angst um Daten zu haben.

Ja das glaub ich auch. Zumindest haben sie es versucht so gut sie es konnten.
Ja, gut, ohne Internetzugang sieht es anders aus. Werden aber die wenigstens so bedacht nutzen.
 
Es gibt einen guten Deep Dive, mit dem die 5090 Sinn ergibt:

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

das Video zeigt ganz gut, wie Nvidia auf zwei Hochzeiten tanzt. Die reine KI Applikation bräuchte sicherlich keine RTX Cores an jeder Einheit und die Gamer brauchen definitiv nicht diese Menge Tensor Transistoren in den Cuda Cores. Auf diese Weise kann Nvidia halt einen Chip produzieren, der dann einfach in den richtigen Markt reinverkauft wird. Gäbe es mehr Konkurrenz die mit spezialisierteren Chips daherkommen würde, wäre Nvidia mehr unter Druck ebenfalls zwei Chip-Linien für zwei Anwendungszwecke herzustellen. Die begrenzte Kapazität an Wafern die TSMC dem Markt zur Verfügugn stellt verhindert jedoch sowohl das eine als auch das andere. Da muss auf dem Weltmarkt erst wieder mehr Kapazität an Spitzennodes entstehen um der aktuellen Entwicklung der stark steigenden Preise pro Wafer entgegenzuwirken. Ansonsten bleibt es wie es ist, sowohl Kunden von TSMC als auch Kunden von Nvidia bekommen mit jedem neuen Node einfach wieder die gleiche Leistung zum gleichen Preis und jede Verbesserung der Marge bleibt zuerst bei TSMC hängen.
 
Zurück