LLMs sind Weltanschauungsreproduktionsmaschinen – Warum ChatGPT die Grünen wählen würde.
Viele scheinen ja zu glauben, Künstliche Intelligenz sei intelligent und müsse deshalb auf alle möglichen Fragen immer die richtige Antwort wissen – am besten noch die objektive Wahrheit. Aus dem Grund ist dann der Aufschrei immer groß, wenn es zu kuriosen Antworten oder eben Halluzinationen kommt. Aus meiner Sicht liegt aber eher auf der menschlichen Seite oft eine falsche Erwartungshaltung und Unkenntnis gegenüber dieser tollen Technologie vor.
Kürzlich wurde hier ein Betrag des Öfteren geteilt, in dem es hieß, dass ChatGPT die Grünen wählen würde. Eine Münchner Beratung sowie einige Zeitungen haben ChatGPT einen Wähler spielen lassen und es gebeten auf die Fragen des Wahl-o-Mat zu antworten mit dem Ergebnis, das die größten Übereinstimmungen < 80% bei den Grünen liegen. Aber woran liegt das eigentlich?
David Rozado hat schon vor ein paar Monaten einen Artikel mit dem Titel „The Political Preferences of LLMs“ veröffentlicht. Laut ihm kommt es zu diesen Ergebnissen jedoch nicht, wie viele Zeitungen schrieben aus den Trainingsdatensätzen oder dem Unsupervised Learning, sondern sind eine Folge des Supervised Fine-Tuning oder des Reinforcement Learnings. Auf gut deutsch: Diese Ergebnisse sind nicht maschinen-, sondern menschengemacht.
„Overall, our results provide support for the hypothesis that a substantial amount of political preferences embedding into LLMs might be happening post-pretraining. Namely, during the supervised fine-tuning (SFT) and/or Reinforcement Learning (RL) stages of the conversational LLMs training pipeline.“
Was mich eigentlich viel mehr wundert ist, dass sich so viele darüber wundern. Diese Maschinen sind menschliche Erzeugnisse. Sie werden auf menschgemachten Daten und menschlicher Sprache trainiert und doch erwarten wir immer wieder von ihnen übermenschliches.
LLM’s sind keine Wahrheitsmaschinen, sie bringen uns auch nicht näher an eine objektive Wahrheit oder Realität heran, sondern sie sind Weltanschauungsreproduktionenmaschinen. Sie reproduzieren Informationen auf Grundlage ihrer Trainingsdaten und erzeugen damit Inhalte gemäß ihres Finetunings und Instruktionen.