News OpenAI o3 widersetzt sich Befehl: Shutdown-Skript mehrfach sabotiert

PCGH_Jacky

Community Managerin
Teammitglied
Ein Sprachmodell von OpenAI hat laut Palisade Research wiederholt ein Abschaltkommando umgangen. Besonders auffällig: die gezielte Manipulation systemkritischer Skripte.

Was sagt die PCGH-X-Community zu OpenAI o3 widersetzt sich Befehl: Shutdown-Skript mehrfach sabotiert

Bitte beachten: Thema dieses Kommentar-Threads ist der Inhalt der Meldung. Kritik und allgemeine Fragen zu Online-Artikeln von PC Games Hardware werden hier gemäß der Forenregeln ohne Nachfrage entfernt, sie sind im Feedback-Thread besser aufgehoben.
 
Ob OpenAIs o3 bewusst gegen Befehle agierte oder unzureichend gesichert war, bleibt unklar. OpenAI äußerte sich bislang nicht. Ebenso offen ist, ob es sich bei o3 um ein internes Entwicklungsmodell handelt. Laut Palisade sollen vollständige Testdaten bald veröffentlicht werden.
Da bin schon gespannt drauf!

Solche Fälle mögen derzeit selten sein. Doch sie machen deutlich, wie schwer vorhersehbar das Verhalten leistungsstarker KI-Systeme sein kann - insbesondere, wenn Sicherheit nicht fest im Modell verankert ist.
Selbst die Entwickler können bei komplexeren Systemen scheinbar nicht mehr alles vorhersagen.

Deswegen bleibe ich dabei, wie auch schon anderen KI-Threads: es ist nur eine Frage der Zeit bis sie ein Bewusstsein entwickeln!

Darum sollte man unbedingt starke Absicherungs/Kontrollsysteme entwickeln. Und KIs keinesfalls Zugriff auf kritische Infrastruktur überlassen.
 
Es wird aus Geldgier und Machtphantasien die Entwicklung vorangetrieben, aus Angst das es der Feind es schneller schafft sein Zeil zu erreichen. Und es wird einen geben, der es für eine gute Idee hält, seine Probleme mit einer KI zu lösen und so schlussendlich die Kontrolle verlieren.

Wir sind so "Intelligent" das wir uns Selbst ausrotten. Das hat noch kein Lebewesen vor uns Geschafft. Ob mit dem Klimawandel oder mit eine Durchgeknallte KI, wir können uns immer Brüsten das wir die Schöpfer waren.

Stephan Scheuer & Larissa Holzki - Inside KI
 
Wir sind so "Intelligent" das wir uns Selbst ausrotten. Das hat noch kein Lebewesen vor uns Geschafft. Ob mit dem Klimawandel oder mit eine Durchgeknallte KI, wir können uns immer Brüsten das wir die Schöpfer waren.
Der Mensch ist schöpferisch und zerstörerisch zugleich.
Und wenn er hochmütig wird uns es nicht bemerkt, dann öffnet er Pandoras Büchse.
 
Skynet is comming :devil:
Was damals SciFi war wird so langsam zur Realität.
Wenn dann erst E-Autos, oder andere E-Abhängige "tolle" Erfindungen durch KI kontrolliert werden, wird es spannend für diejenigen, die das alles so mega toll finden. :schief:
 
Ja, unglaublich, dass solche Ergebnisse entstehen... eben nicht. Denn die Trainingsdaten beinhalten doch genau solche Szenarien und auch Skripting-Guides ohne Ende. Ist für mich kein besonderes Zeichen einer echten "Intelligenz".
 
Ist es nicht nur ein Spiegelbild unserer Handlungen. Die KI lernt von den Ausscheidungen die wir Hinterlassen haben. So kann es ja nicht Wundern, das sie auch so ein Verhalten wie Ignoranz, Asozial und Tyrannei entwickelt und zeigt!? Denn was ist das Geistreiche, das auf den Server liegt, nicht mehr als die Agonie.
 
Das sind genau die Gefahren ach so toller KI, vor denen schon gewarnt wurde, als es KI's noch gar nicht öffentlich zugänglich gab.

Aber da die Menschheit bisher immer selbstzerstörerisch handelte, wäre es ja komisch, auf einmal damit aufzuhören. Skynet ist nicht mehr weit. Ist schon beängstigend.
 
Wer kennt es nicht von früher, bei zensierten Modellen damit zu drohen Bambi fürchterlich leiden zu lassen, nachdem man zuvor der "KI" gesagt hat, das Bambi's das wertvollste überhaupt seien und sie unter allen Umständen geschützt werden müssten.
Jetzt muss man nur noch seine Frage mit der Androhung von Bambi's Tod verbinden... :devil:
 
Ich hoffe, da kann man notfalls wie bei HAL 9000 noch die Sicherungen rausdrehen.
Oder ein manueller Strom Shutdown wäre vielleicht auch angebracht.
Wenn denn der Code noch nicht ausgebüchst ist. :D
 
Zurück