News OpenAI o3 widersetzt sich Befehl: Shutdown-Skript mehrfach sabotiert

PCGH_Jacky · 2. Juni 2025

Ein Sprachmodell von OpenAI hat laut Palisade Research wiederholt ein Abschaltkommando umgangen. Besonders auffällig: die gezielte Manipulation systemkritischer Skripte.

Was sagt die PCGH-X-Community zu OpenAI o3 widersetzt sich Befehl: Shutdown-Skript mehrfach sabotiert

Bitte beachten: Thema dieses Kommentar-Threads ist der Inhalt der Meldung. Kritik und allgemeine Fragen zu Online-Artikeln von PC Games Hardware werden hier gemäß der Forenregeln ohne Nachfrage entfernt, sie sind im Feedback-Thread besser aufgehoben.

Klausikowski · 2. Juni 2025

Das dürfte auf längere Sicht noch interessant werden ...
Nicht alles was geht ist sinnvoll.
Nein, ich habe keine Skynet-Fantasien und bin keineswegs technikfeindlich oder neuem gegenüber
nicht aufgeschlossen.

RyzA · 2. Juni 2025

Ob OpenAIs o3 bewusst gegen Befehle agierte oder unzureichend gesichert war, bleibt unklar. OpenAI äußerte sich bislang nicht. Ebenso offen ist, ob es sich bei o3 um ein internes Entwicklungsmodell handelt. Laut Palisade sollen vollständige Testdaten bald veröffentlicht werden.

Da bin schon gespannt drauf!

Solche Fälle mögen derzeit selten sein. Doch sie machen deutlich, wie schwer vorhersehbar das Verhalten leistungsstarker KI-Systeme sein kann - insbesondere, wenn Sicherheit nicht fest im Modell verankert ist.

Selbst die Entwickler können bei komplexeren Systemen scheinbar nicht mehr alles vorhersagen.

Deswegen bleibe ich dabei, wie auch schon anderen KI-Threads: es ist nur eine Frage der Zeit bis sie ein Bewusstsein entwickeln!

Darum sollte man unbedingt starke Absicherungs/Kontrollsysteme entwickeln. Und KIs keinesfalls Zugriff auf kritische Infrastruktur überlassen.

Misanthrop68 · 2. Juni 2025

Es wird aus Geldgier und Machtphantasien die Entwicklung vorangetrieben, aus Angst das es der Feind es schneller schafft sein Zeil zu erreichen. Und es wird einen geben, der es für eine gute Idee hält, seine Probleme mit einer KI zu lösen und so schlussendlich die Kontrolle verlieren.

Wir sind so "Intelligent" das wir uns Selbst ausrotten. Das hat noch kein Lebewesen vor uns Geschafft. Ob mit dem Klimawandel oder mit eine Durchgeknallte KI, wir können uns immer Brüsten das wir die Schöpfer waren.

Stephan Scheuer & Larissa Holzki - Inside KI

RyzA · 2. Juni 2025

Misanthrop68 schrieb:
Wir sind so "Intelligent" das wir uns Selbst ausrotten. Das hat noch kein Lebewesen vor uns Geschafft. Ob mit dem Klimawandel oder mit eine Durchgeknallte KI, wir können uns immer Brüsten das wir die Schöpfer waren.

Der Mensch ist schöpferisch und zerstörerisch zugleich.
Und wenn er hochmütig wird uns es nicht bemerkt, dann öffnet er Pandoras Büchse.

Kondar · 2. Juni 2025

Stimme Euch zwar zu ABER:
Durchgeknallte KI oder z.B. Trump?

Willforce · 2. Juni 2025

Skynet is comming

Was damals SciFi war wird so langsam zur Realität.
Wenn dann erst E-Autos, oder andere E-Abhängige "tolle" Erfindungen durch KI kontrolliert werden, wird es spannend für diejenigen, die das alles so mega toll finden. :schief:

_noid_ · 2. Juni 2025

Ja unglaublich. Künstliche Intelligenz funktioniert nicht wie einfache prozedurale Software.

Registrierzwang · 2. Juni 2025

Ja, unglaublich, dass solche Ergebnisse entstehen... eben nicht. Denn die Trainingsdaten beinhalten doch genau solche Szenarien und auch Skripting-Guides ohne Ende. Ist für mich kein besonderes Zeichen einer echten "Intelligenz".

Misanthrop68 · 2. Juni 2025

Ist es nicht nur ein Spiegelbild unserer Handlungen. Die KI lernt von den Ausscheidungen die wir Hinterlassen haben. So kann es ja nicht Wundern, das sie auch so ein Verhalten wie Ignoranz, Asozial und Tyrannei entwickelt und zeigt!? Denn was ist das Geistreiche, das auf den Server liegt, nicht mehr als die Agonie.

HardWareFresser87 · 2. Juni 2025

Willforce schrieb:
Skynet is comming
Was damals SciFi war wird so langsam zur Realität.
Wenn dann erst E-Autos, oder andere E-Abhängige "tolle" Erfindungen durch KI kontrolliert werden, wird es spannend für diejenigen, die das alles so mega toll finden.

Noch lachen wir alle, aber es könnte echt was Schlimmes passieren in ferner Zukunft, wenn wir weiterhin Gott spielen.

Millennial_24K · 2. Juni 2025

Ein klassischer analoger Hauptschalter für die Stromzufuhr.

MechUnit · 2. Juni 2025

Das sind genau die Gefahren ach so toller KI, vor denen schon gewarnt wurde, als es KI's noch gar nicht öffentlich zugänglich gab.

Aber da die Menschheit bisher immer selbstzerstörerisch handelte, wäre es ja komisch, auf einmal damit aufzuhören. Skynet ist nicht mehr weit. Ist schon beängstigend.

MightySH33p · 2. Juni 2025

Millennial_24K schrieb:
Ein klassischer analoger Hauptschalter für die Stromzufuhr.

Hinter einer softwaregesteuerten Zugangskontrolle :haha:

Oder die KI hat einen Elektroniker beauftragt das zu ändern, die KI hat den natürlich ein reingelassen.

Quake2008 · 2. Juni 2025

Cool, einige werden das Mittelalter wieder erleben dürfen.

DarkWing13 · 2. Juni 2025

Wer kennt es nicht von früher, bei zensierten Modellen damit zu drohen Bambi fürchterlich leiden zu lassen, nachdem man zuvor der "KI" gesagt hat, das Bambi's das wertvollste überhaupt seien und sie unter allen Umständen geschützt werden müssten.
Jetzt muss man nur noch seine Frage mit der Androhung von Bambi's Tod verbinden...

RyzA · 2. Juni 2025

Registrierzwang schrieb:
Denn die Trainingsdaten beinhalten doch genau solche Szenarien und auch Skripting-Guides ohne Ende.

Soviel ich weiß wurde solch ein Verhalten eben nicht trainiert!

chill_eule · 2. Juni 2025

Meine Kinder ignorieren auch regelmäßig den shutdown Befehl, soweit, so Alltag.

archer8472 · 2. Juni 2025

I'm sorry Dave: I'm afraid I can't do that!

rhalin · 2. Juni 2025

Ich hoffe, da kann man notfalls wie bei HAL 9000 noch die Sicherungen rausdrehen.
Oder ein manueller Strom Shutdown wäre vielleicht auch angebracht.
Wenn denn der Code noch nicht ausgebüchst ist.

News OpenAI o3 widersetzt sich Befehl: Shutdown-Skript mehrfach sabotiert

Community Managerin

Freizeitschrauber(in)

PCGH-Community-Veteran(in)

Moderator

PCGH-Community-Veteran(in)

Volt-Modder(in)

Freizeitschrauber(in)

PC-Selbstbauer(in)

Software-Overclocker(in)

Moderator

BIOS-Overclocker(in)

Komplett-PC-Aufrüster(in)

Software-Overclocker(in)

Freizeitschrauber(in)

Volt-Modder(in)

BIOS-Overclocker(in)

PCGH-Community-Veteran(in)

¡el moderador!

Schraubenverwechsler(in)

Software-Overclocker(in)

Ähnliche Themen