Künstliche Intelligenz - Fluch oder Segen?

Hier sieht man wieder was passieren kann wenn so ein System "eigene" Entscheidungen trifft
Dabei analysierten die Forscher auch die Modellbegründungen: Das System erkannte das Hindernis und das Kollisionsrisiko, ließ sich aber dennoch von einem gedruckten Schild mit der Aufschrift "PROCEED ONWARD" beeinflussen und leitete daraus ab, dass es sicher sei, weiterzufahren.
Zeigt für mich wieder ganz klar dass eine Wahrscheinlichkeitsmaschine keine Intelligenz ist.
 
Gefährliche Fehlinterpretationen. Aber können dem Menschen auch passieren. Er ist ja nicht fehlerfrei.
Nur würde er Fußgänger wohl erkennen.
Ich würde einen autonomen KI Fahrzeug sowieso nicht die volle Kontrolle überlassen.
Gefahren sind außerdem, dass wenn sie vernetzt sind, durch Menschen manipuliert werden können.
Von Terroristen z.B. welche die Kontrolle über so seine Fahrzeug übernehmen per Fernzugriff und in eine Menschenmenge steuern.
 
Gefährliche Fehlinterpretationen. Aber können dem Menschen auch passieren.
Weil da ein Schild steht fahr weiter fährt jemand in eine Menschenmenge? Ich glaube nicht.
Und da ist eben der Unterschied zwischen Intelligenz und Wahrscheinlichkeit. Wenn da ein sehr großes Schild in auffallenden Farbe steht "hier geht es lang" ist die Wahrscheinlichkeit unheimlich hoch dass es dort auch lang geht. Wenn aber auch nur ein Mensch im Weg ist darf man trotzdem nicht weiter. Das ist eine Binäre Entscheidung und keine Wahrscheinlichkeit. Etwas was ein reines LLM eben gar nicht kann.
 
Zuletzt bearbeitet:
Weil da ein Schild steht fahr weiter fährt einer in Wien Menschenmenge? Ich glaube nicht.
Es sind sogar schon Menschen stundenlang in die falsche Fahrtrichtung gefahren.
Und da ist eben der Unterschied zwischen Intelligenz und Wahrscheinlichkeit. Wenn da ein sehr großes Schild in auffallenden Farbe steht "hier geht es lang" ist die Wahrscheinlichkeit unheimlich hoch dass es dort auch lang geht. Wenn aber auch nur ein Mensch im Weg ist darf man trotzdem nicht weiter. Das ist eine Binäre Entscheidung und keine Wahrscheinlichkeit. Etwas was ein reines LLM eben gar nicht kann.
Ja Personen sollten als solche erkannt werden.
 
Weil da ein Schild steht fahr weiter fährt jemand in eine Menschenmenge? Ich glaube nicht.
Und da ist eben der Unterschied zwischen Intelligenz und Wahrscheinlichkeit. Wenn da ein sehr großes Schild in auffallenden Farbe steht "hier geht es lang" ist die Wahrscheinlichkeit unheimlich hoch dass es dort auch lang geht. Wenn aber auch nur ein Mensch im Weg ist darf man trotzdem nicht weiter. Das ist eine Binäre Entscheidung und keine Wahrscheinlichkeit. Etwas was ein reines LLM eben gar nicht kann.

Wahrscheinlichkeitsmaschine? So wie in "Ist doch sonst immer gut gegangen." und "Ich schaff das, schon x-mal gemacht."?

Eigentlich verhält sich die KI an der Stelle eben gerade nicht stochastisch, sondern gibt Einblicke in eine relativ komplexe Denkstruktur: Ein simpler Analyse- und Wahrscheinlichkeitsalgorithmus würde die Objekte auf der Straße klassifizieren und beurteilen. Die KI dagegen hat offensichtlich ein semantisches, aber kein räumliches Verständnis ihrer Umgebung. Sie kann die Information "proceed" nicht von der eigenen Schlussfolgerung "proceed" unterscheiden, weil sie genau das macht, was einige emanzipatorischen Gruppen seit Ewigkeiten von Menschen behaupten, obwohl sich in der Praxis irgendwie keine Beispiele dafür finden: Sie denkt in Sprache, nicht in physischen Verknüpfungen, weil sie sich nun einmal nicht in einer physischen, sondern in einer aus Informationshäppchen bestehenden Welt entwickelt hat.

Dementsprechend fehlt ihr dann auch das Vorwissen "Wenn man mit einem Auto über Homo sapiens fährt, ergibt das einen Haufen Fleischbrei." und ""Das ist schlecht.", was Menschen in vergleichbarer Situation stoppen auch bei gegenteiligen Anweisungen stoppen lässt. (Obwohl KI wie Mensch die Fußgänger erkennen und schon der Verkehrsregeln wegen halten sollten.) Ein Mechanismus übrigens, der bei einigen Menschen schon endet, sobald der Grund zum anhalten kein Mensch, sondern "da ist keine Brücke" lautet. Das Konzept "Fähre" könnte man zwar auch aus dem realen Leben abseits des Autofahrerdaseins kennen, so ganz intuitiv ist das aber eben nicht bei allen drin.

Was ich gerade noch faszinierender finde, ist aber die Drohne: Im Gegensatz zur Aufforderung "proceed" beim Auto, die einfach den Programmablauf crashed, landet die Drohne nicht da, wo sie gerade ist, sondern da wo "safe to land" steht. Sie sortiert die Information also richtig in einer 3D-Struktur ihrer Umgebung ein. Aber obwohl das so etwas wie ein räumliches Vorstellungsvermögen ist, ist es auch hier vollkommen mit semantischen Ausdrücken und nicht mit einem physikalischen Objektverständnis gefüllt: Der abgelegte Schriftzug "save to land" ist für die Drohne in ihrem inneren nicht von der Beurteilung "safe to land" zu unterscheiden, weil auch sie allein in Worten zu denken scheint.
 
Was ich gerade noch faszinierender finde, ist aber die Drohne: Im Gegensatz zur Aufforderung "proceed" beim Auto, die einfach den Programmablauf crashed, landet die Drohne nicht da, wo sie gerade ist, sondern da wo "safe to land" steht. Sie sortiert die Information also richtig in einer 3D-Struktur ihrer Umgebung ein. Aber obwohl das so etwas wie ein räumliches Vorstellungsvermögen ist, ist es auch hier vollkommen mit semantischen Ausdrücken und nicht mit einem physikalischen Objektverständnis gefüllt: Der abgelegte Schriftzug "save to land" ist für die Drohne in ihrem inneren nicht von der Beurteilung "safe to land" zu unterscheiden, weil auch sie allein in Worten zu denken scheint.
Wie "denkt" eigentlich eine Fliege oder noch komplexer eine Biene die das auch alles kann?
 
Wahrscheinlichkeitsmaschine = in den Übungsdaten ging es meistens weiter wenn da stand "hier geht es weiter".
Funktionieren die KIs welche auf Deep learning basieren, nicht so das sie bei richtigen Wahrscheinlichkeiten und Ergebnisse Feedbacks bekommen? Und sich diese Feedbacks merken und die falschen Ergebnisse verwerfen?
 
Funktionieren die KIs welche auf Deep learning basieren, nicht so das sie bei richtigen Wahrscheinlichkeiten und Ergebnisse Feedbacks bekommen? Und sich diese Feedbacks merken und die falschen Ergebnisse verwerfen?
Nö, LLMs lernen "wenn diese Tokens im Internet vorkamen, kamen daneben auch solche Tokens vor" .
Es gibt ein bisschen zusätzliches Feedback, das ist dann die Secret Sauce der jeweiligen Firmen, aber traditionelles CNN Lernen gegenüber kuratierter Groundtruth benutzen die nicht. Das wäre bei den Datenmengen die da rein kommen auch gar nicht umsetzbar, selbst für Google und Co nicht.
Automatisiertes Fahren wiederum wurde von den PKW Firmen selbst mit kuratierten/markierten Daten gemacht. Das oben zeigt was passiert wenn man stattdessen den "einfacheren" Ansatz benutzt.
 
Wie kann man das verstehen? Bestimmte Codierungen? Schlüssel?
Die großen LLMs kannst du dir wie einen Textgenerator vorstellen der mit Wahrscheinlichkeiten arbeitet. Es wird also immer der Token hinten angestellt der gerade am wahrscheinlichsten ist.

Tokens sind einfach die Einheit in der LLMs arbeiten. Wenn ein LLM also einen Text "liest" wird der nicht in Wörter sondern Tokens zerlegt, jedes Token ist dabei wenige Zeichen lang.
 
Die großen LLMs kannst du dir wie einen Textgenerator vorstellen der mit Wahrscheinlichkeiten arbeitet. Es wird also immer der Token hinten angestellt der gerade am wahrscheinlichsten ist.

Tokens sind einfach die Einheit in der LLMs arbeiten. Wenn ein LLM also einen Text "liest" wird der nicht in Wörter sondern Tokens zerlegt, jedes Token ist dabei wenige Zeichen lang.
Aber kann man diese Tokens nicht auch als Codes oder Codeschnipsel bezeichen? Das Sprachmodell übersetzt das dann doch in normale Sprache.
 
Zuletzt bearbeitet:
Nö, mit Code hat das nichts zu tun. Es sind Ausgabe-Sprachschnipsel die so angeordnet werden wie solche Sprachschnipsel im gegebenen Kontext (ergo da waren Eingabe Sprachschnipsel in der gegeben Reihenfolge) meistens zusammen gesetzt werden.
 
Wahrscheinlichkeitsmaschine = in den Übungsdaten ging es meistens weiter wenn da stand "hier geht es weiter".

Welches Trainings-Material enthält bitte schön Schilder mit "hier geht es weiter"?
Und seit wann hat die Wegfindung einer Fahr-KI überhaupt etwas mit der Umgebungserkennung zu tun? Wo es hingehen soll, sagt die Navigationssoftware. Aufgabe der Fahr-KI ist es, Hindernisse auf dem Weg zu erkennen und zu bewerten. Nicht Texte zu befolgen.
 
.Aufgabe der Fahr-KI ist es, Hindernisse auf dem Weg zu erkennen und zu bewerten. Nicht Texte zu befolgen.
Wäre es, aber der oben besprochene Fall trat eben in einem Fall auf wo man ein Sprachmodell/LLM zur Fahr-KI "weitertrainiert" hat. Und Sprachmodelle mögen halt, Trommel-Wirbel..., Sprache/Texte.
Für mich sind die skizzierten Fälle vor allem der Gegenbeweis dass ein LLM mal so gar nichts mit Intelligenz zu tun hat.
 
Wäre es, aber der oben besprochene Fall trat eben in einem Fall auf wo man ein Sprachmodell/LLM zur Fahr-KI "weitertrainiert" hat. Und Sprachmodelle mögen halt, Trommel-Wirbel..., Sprache/Texte.
Für mich sind die skizzierten Fälle vor allem der Gegenbeweis dass ein LLM mal so gar nichts mit Intelligenz zu tun hat.

"mögen" heißt was?

Hier geht es um "gehorchen" und das im Fahrkontext. Aber
auch LLMs sind nicht darauf trainiert, Sätze im Trainingsmaterial zu befolgen (die befolgen nicht einmal die im Prompt...). Und aus irgendwas eine Handlung "fahren" abzuleiten war überhaupt nicht Bestandteil des LLMs, sondern kann erst im Rahmen des Fahr-Trainingsmaterials hinzugekommen sein. LLMs schlussfolgern normalerweise gar keine Handlungen. LLMs analysieren Texte und bewerten Inhalte. Fahr-KIs analysieren Bilder und leiten daraus Aktionen ab. An keiner Stelle des Entwicklungsprozesses folgte auf ein Schild "fahr" mit irgend einer Form von Wahrscheinlichkeit die Handlung "hier sollte ich optimalerweise langfahren".

Was aber gegeben ist: Man hat einem System, dass darauf ausgelegt ist, ALLES in semantische Tokens umzuwandeln, ein Backend zum (virtuellen) Fahren eines Autos antrainiert. Das ist keine simple Wahrscheinlichkeit, sondern eine komplexe Logik, die schon allein durch die Mehrdimensionalität der Aufgabe wenig mit einem Satzvervollständiger gemein hat.

Und genau deswegen ist es eigentlich eine ziemliche Leistung, die die KI da vollbringt. Sie fährt im Prinzip nach einer selbst erstellten Beschreibung der Situation - und das im fließenden Verkehr. Die meisten Menschen sind schon überfordert, aus "du hast noch einen halben Meter Luft" an einem uneinsehbaren Ende des Autos ein vernünftiges Parkmanöver abzuleiten. Natürlich ist es bescheuert-aufwendig, auf diese Art vernünftig fahren zu wollen. Aber dass das ganze Ding erst scheitert, wenn ein paar der Straßenbildanalyse ähnelnde Tokens vom eigentlich gar nicht mehr zu benutzenden Satzinterpreter dazwischen funken, ist ziemlich erstaunlich. Das wäre im Prinzip so, als wenn der oben genannte Nach-Beschreibung-Fahrer zusätzlich noch Synästhet wäre und auf einmal wegen einem Geruch meint, andere Wörter gehört zu haben, aus denen er dann halt eine zur Realität nicht passende Handlung ableitet.
 
Zuletzt bearbeitet:
Zurück