Nvidia Hopper: Gewaltige H100-GPU zeigt sich auf ersten Fotos

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu Nvidia Hopper: Gewaltige H100-GPU zeigt sich auf ersten Fotos

Nvidias H100 zeigt sich mehr als einen Monat nach der offiziellen Vorstellung nun auch auf ersten Fotos. Abgelichtet wurde das SXM-Modul, welches gegenüber der PCI-Express-Variante nicht nur mehr CUDA-Cores und somit Leistung liefert, sondern auch die doppelte TDP aufweist.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

Zurück zum Artikel: Nvidia Hopper: Gewaltige H100-GPU zeigt sich auf ersten Fotos
 
Wohlgemerkt gibt es mit der H100 immerhin auch mehr als die zweieinhalbfache Leistung.

ist das so? also klar, ein paar fp32-units mehr und natürlich 3tb/s statt 2tb/S speicherbandbreite, aber bringt da die "nur" verdoppelte tdp ernsthaft eine mehr als 2 1/2fache leistung? skaliert das in dem fall so gut?
 
ist das so? also klar, ein paar fp32-units mehr und natürlich 3tb/s statt 2tb/S speicherbandbreite, aber bringt da die "nur" verdoppelte tdp ernsthaft eine mehr als 2 1/2fache leistung? skaliert das in dem fall so gut?
A100_vs_H100.png

Der Chip legt tatsächlich beträchtlich zu. Die absolute Leistung steigt etwa um das Dreifache, der absolute Verbrauch steigt zwar an aber die Perf/Watt-Werte erhöhen sich beträchtlich.

Zu beachten:
  • Beide Chips verwenden nicht den Vollausbau und beide Chips deaktivieren zwei HBM-Controller, sodass nur 5 HBM-Stacks genutzt werden (Yield).
    Ergänzend könnte man noch vermuten, dass der Yield auf dem "4N" sehr gut ist, denn beim A100 entschloss man sich nur 84 % der Einheiten auf dem finalen Produkt zu nutzen während man beim H100 fast 92 % der verfügbaren Einheiten freischaltet.
  • Während nVidia beim A100 noch vielfach eine Nachkommastelle angab, gibt es bei Hopper nur noch gerundete, ganze Zahlen, was zu Rundungsfehlern führt und bspw. zu einer gewissen Schwankungsbreite zum zurückgerechneten Peak-Takt.
  • Hopper organisiert die SMs um und fasst nun doppelt so viele FP32- und FP64-Einheiten in einem SM zusammen. Die Anzahl der Tensor Cores bleibt bei weiterhin 4 pro SM.
  • Bzgl. FP64 im Vergleich zur Konkurrenz ist zu beachten, dass die Performance der regulären ALUs nicht mehr die Gesamtleistung ausweist, da auch die Tensor Cores schon seit Ampere über IEEE-kompatible FP64-Funktionalität verfügen und diese noch steigern können.
  • In Anlehnung an den News-Titel anzumerken ist, dass Hopper flächentechnisch gar etwas kleiner als Ampere in Form des A100 ist. ;-)
  • Bezüglich Lovelace kann man noch keine verlässlichen Ableitungen treffen. Das mit dem "4N" gezeigte verspricht einiges, aber noch weiß man nicht, ob Lovelace auch den "4N" verwenden wird (auch wenn es vielleicht naheliegend erscheint). Hier muss man abwarten ...
 
Zuletzt bearbeitet:
Hierbei handelt es sich um ein reines Industrieprodukt. Beim Preis eines gehobenen Kleinwagens pro einzelner Karte ist da bei der Kundschaft kein Platz für die von dir implizierten "Werbespielchen", d. h. dein Glaube ist hier irrelevant. ;-)
 
Zurück