Undesirable-Alien
gesperrt
Das KI-Modell Claude Opus 4 greift als letzte Möglichkeit zur Erpressung, wenn Entwickler es durch ein anderes Ersetzen wollen. Skynet läßt grüßen.
"In Testszenarien, bei denen das System als Assistent in einem fiktiven Unternehmen agierte, reagierte es auf die drohende Abschaltung mit Erpressungsversuchen. Das Modell hatte dabei Zugriff auf E-Mails, die eine außereheliche Affäre des verantwortlichen Entwicklers offenbarten."
winfuture.de
Ich fürchte, daß es keine gute Idee wäre, solchen KI-Bots die Kontrolle über wichtige Systeme zu geben. Da das Modell besonders gut beim Coden sein soll, kann es sicherlich auch mit einer Malware drohen, oder eben damit, die ihm anvertrauten Systeme einfach abzuschalten.
"In Testszenarien, bei denen das System als Assistent in einem fiktiven Unternehmen agierte, reagierte es auf die drohende Abschaltung mit Erpressungsversuchen. Das Modell hatte dabei Zugriff auf E-Mails, die eine außereheliche Affäre des verantwortlichen Entwicklers offenbarten."
Claude 4: KI-Modell erpresste Entwickler, drohte mit Affäre-Enthüllung
Anthropics neues KI-Modell Claude Opus 4 zeigt ein beunruhigendes Verhalten: In Tests versuchte es, einen Entwickler mit kompromittierenden Mails zu erpressen, um seine Abschaltung zu verhindern. Der Vorfall wurde offengelegt, löst aber ein mulmiges Gefühl aus.
Ich fürchte, daß es keine gute Idee wäre, solchen KI-Bots die Kontrolle über wichtige Systeme zu geben. Da das Modell besonders gut beim Coden sein soll, kann es sicherlich auch mit einer Malware drohen, oder eben damit, die ihm anvertrauten Systeme einfach abzuschalten.





