News HC1: Effizienz-Monster soll Nvidia ohne Speicher deklassieren

PCGH_Sven

PCGH-Autor
Der Taalas HC1 ist mehr als ein KI-Beschleuniger, er ist Sprachmodell in einem Chip. Das kanadische Start-up gießt Llama 3.1 in Silizium und erschafft damit ein Effizienz-Monster, welches AMD und Nvidia deklassiert und das ganz ohne RAM.

Was sagt die PCGH-X-Community zu HC1: Effizienz-Monster soll Nvidia ohne Speicher deklassieren

Bitte beachten: Thema dieses Kommentar-Threads ist der Inhalt der Meldung. Kritik und allgemeine Fragen zu Online-Artikeln von PC Games Hardware werden hier gemäß der Forenregeln ohne Nachfrage entfernt, sie sind im Feedback-Thread besser aufgehoben.
 
Sehr geil! Das wäre eine wirkliche Eruption. Bleibt natürlich in welchen Stückzahlen das verfügbar wird und natürlich zu welchem Preis. Das könnte schwere Zeiten für die bisherigen KI Karten Hersteller bedeuten bzw diese müssen auch in solche Technologie investieren. Kaum zu glauben so ganz ohne Speicher. Das kann in absehbarer Zeit den Markt durchwürfeln.
 
Sehr gut ,durch das wird am Ende weniger Speicher benötigt. Und wenn es so weiter geht und sich das durch setzt ,dann wird immer mehr und mehr weniger Speicher benötigt. Und wenn immer weniger benötigt ,sinkt irgendwann doch schneller als gedacht der Speicherpreis wieder. Super. Finde ich ne gute Sache.
 
Wäre ein ziemlich aufwendiger Aprilscherz.

 
Ne, eher das: https://www.pcgameshardware.de/Wasserkuehlung-Hardware-217994/Specials/Toiletten-PC-1523953/
Nein!
Wäre ein ziemlich aufwendiger Aprilscherz.

Ich war zu spät! :ugly:
 
Also ernsthaft jetzt... das klingt einfach absolut nicht real :what:
Das muss doch ein Aprilscherz sein :devil:

Und das ist nur zur Ablenkung gemacht, ist ja offensichtlich ein Aprilscherz :ugly::D
Na das wäre doch recht aufwendig für einen Aprilscherz so mit eigenem Internetauftritt. Btw es gab ja auch schon Meldungen die vor dem heutigen Tag veröffentlicht wurden. Wenn es ein Aprilscherz ist hat man dafür sehr viel Aufwand betrieben.
Ob das Produkt tatsächlich das kann was da offeriert wird steht auf einem anderen Blatt, einen Aprilscherz sehe ich aber nicht.


Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
FPGAs sind übrigens nicht spezialisiert. Das "P" steht für "programmable". Wäre aber mal interessant zu wissen, wie viel damit ginge. Die sind zwar nicht so effizient wie ASICs, aber nicht jedes mal, wenn ein neues Modell rauskommt, alle alten Chips wegschmeißen zu müssen, wäre ja schon ein Vorteil.

Wenn man vor allem nicht so viele Daten von und zu einem Speicher schaufeln muss, ist man vielleicht auch deutlich weniger auf einen Chip oder auch ein Board beschränkt.
Das könnte schwere Zeiten für die bisherigen KI Karten Hersteller bedeuten bzw diese müssen auch in solche Technologie investieren. Kaum zu glauben so ganz ohne Speicher. Das kann in absehbarer Zeit den Markt durchwürfeln.
Naja, für das Training werden vermutlich weiterhin GPUs mit Speicher benötigt. :(
 
Von eingebauten Sound und Netzwerkkarten zu "KI" Karten, evtl auch in einer schwächeren Ausführung für Privatanwender ?
Das wäre doch was.
Z.B. DPUs für die Auslagerung von Netzwerk-/Kommunikationsprozessen gibt es ja schon länger. Karten speziell für Maschinelles Lernen haben Facebook & Google schon vor einem Jahrzehnt benutzt.

Für den Privatanwender lohnt sich sowas alles aber nicht.
 
FPGAs sind übrigens nicht spezialisiert. Das "P" steht für "programmable". Wäre aber mal interessant zu wissen, wie viel damit ginge. Die sind zwar nicht so effizient wie ASICs, aber nicht jedes mal, wenn ein neues Modell rauskommt, alle alten Chips wegschmeißen zu müssen, wäre ja schon ein Vorteil.

Neben passend verschalteten Rechenwerken brauchst du auch lokal integrierten Speicher für die Modellparameter, mit denen eingehende Daten verrechnet werden sollen. FPGAs für große Speichermengen zu nutzen ist aber unbezahlbar teuer/aufwendig, wiegt alle etwaigen Vorteile mehr als auf. Ich würde mir von Taalas erstmal eine Erklärung wünschen, wie sie ein Modell mit 8 Milliarden Parametern überhaupt in einen Chip mit 53 Milliarden Transistoren laden. Selbst wenn ich nur 10 Prozent des Chips für Recheneinheiten, Ansteuerung, Vernetzung und zu verarbeitende Daten reserviere, bleiben 6 Transistoren pro Parameter. Das reicht für eine klassische 6T-SRAM-Zelle, also für 1 Bit Genauigkeit. Nach eigenen Angaben arbeitet Taalas aber mit 3 bis 6 Bit und Llama eigentlich sogar mit 16 Bit.
 
Zuletzt bearbeitet:
Klar sicher kein Aprilscherz.
Ne kleine Internetseite, Kontakt geht nicht, weil zu hohe Nachfrage und der KI Chatbot kennt das eigene Produkt noch nicht mal.
 
Es findet sich da doch einiges und zwar schon Im Februar.




 
Neben passend verschalteten Rechenwerken brauchst du auch lokal integrierten Speicher für die Modellparameter, mit denen eingehende Daten verrechnet werden sollen. FPGAs für große Speichermengen zu nutzen ist aber unbezahlbar teuer/aufwendig, wiegt alle etwaigen Vorteile mehr als auf.
Naja, wenn HBM drei mal so teuer ist wie "normaler" DRAM, ist SRAM, aus dem FPGAs ja im Endeffekt hauptsächlich bestehen, schon nur noch etwas mehr als doppelt so teuer. So viel höher müsste die Effizienz dann auch nicht mehr sein, damit sich das lohnt. Könnte halt sein, dass man das nicht in einen Chip bekommt, könnte aber eben halt auch sein, dass man das gar nicht muss.
Ich würde mir von Taalas erstmal eine Erklärung wünschen, wie sie ein Modell mit 8 Milliarden Parametern überhaupt in einen Chip mit 53 Milliarden Transistoren laden. Selbst wenn ich nur 10 Prozent des Chips für Recheneinheiten, Ansteuerung, Vernetzung und zu verarbeitende Daten reserviere, bleiben 6 Transistoren pro Parameter. Das reicht für eine klassische 6T-SRAM-Zelle, also für 1 Bit Genauigkeit. Nach eigenen Angaben arbeitet Taalas aber mit 3 bis 6 Bit und Llama eigentlich sogar mit 16 Bit.
Ich denke mal, dass man keine Speicherzellen für die Gewichte braucht, wenn die fix sind. Nur noch Leitungen zur Versorgungsspannung und Masse.
 
Sag ich schon länger.
Der wirklich Durchbruch werden ganz anders gedachte Chips sein. ASIC's, die genau auf Stochastic Compute und nicht in Massen skalierbaren Determinismus ausgelegt sind.


Dank des heutigen Datums glaube ich dass erst morgen 😅🫢
Folge einfach mal den verlinkten Quellen.
Die Meldungen sind schon vom 30.03.

Diese Meldung schon vom Februar:


---
Könnten manche Leute mal bitte aufhören unter JEDEN Artikel "APRIL, APRIL" als Einzelbeitrag zu schreiben?!
Das grenzt ja schon an SPAM!
 
Zuletzt bearbeitet:
Zurück