Bevor Sie einen unserer Beiträge lesen, möchten wir Sie bitten, an der Initialen Befragung teilzunehmen. Hier werden allgemeine Einstellungen zu KI und Technik abgefragt, welche möglicherweise durch das Lesen eines Beitrags schon beeinflusst werden könnten.
Wenn Sie an dieser Umfrage bereits teilgenommen haben, können Sie die Info ignorieren.
Menschliches Denken ist unfassbar flexibel, wir können jederzeit neue Kompetenzen erlernen und uns an neue Gegebenheiten anpassen. Aber wie ist das bei KI?
Im Gegensatz zu den meisten KI-Systemen haben Menschen sogenannte Allgemeine Intelligenz, die nicht auf einen sehr engen Anwendungsbereich beschränkt ist. Ein Grundschulkind das in der Lage ist, den Inhalt eines Bilderbuchs zusammenzufassen, wird auch in der Lage sein Hunde von Katzen zu unterscheiden ein Legohaus zu bauen oder den Weg von zu Hause in die Schule zu finden.
Menschen sind auch in der Lage, ihre eigenen Denkprozesse zumindest teilweise zu beurteilen, verfügen also über Meta-Kognition. So wissen wir, ob wir uns bei einer Sache ganz sicher sind oder nicht, oder ob wir einen bestimmten Gegenstand kennen oder ob er neu für uns ist. Hinter vielen unserer langfristigen Pläne sowie auch bei kreativen Prozessen steckt unsere Fähigkeit uns eigene Ziele zu setzen und zu beurteilen wann wir diese erreicht haben. Menschen verfügen also über Intentionalität. Unsere Wahrnehmung der Welt sowie die Interaktion mit anderen Menschen basiert auf der Fähigkeit des inneren Erlebens (Qualia). Berichtet uns eine Person, dass sie Kopfschmerzen hat, können wir Mitleid empfinden wenn wir sagen „Das tut mir leid” basiert diese Aussage darauf, dass wir nachempfinden können wie sich so etwas anfühlt.
Generative KI
Allgemeine Intelligenz zu erreichen ist insbesondere das Ziel vieler großer Unternehmen wie OpenAI, Google oder DeepSeek, die große Sprachmodelle trainieren und zur Nutzung anbieten. Diese Ansätze werden als Generative KI bezeichnet. Sie basieren auf Künstlichen Neuronalen Netzen, die wir in den letzten Artikeln eingeführt haben.
Im Gegensatz zu Neuronalen Netzen, die Eingaben klassifizieren, zum Beispiel angeben ob auf einem Bild ein Hund oder eine Katze zu sehen ist, zeichnet sich Generative KI dadurch aus, dass aus Anweisungen in natürlicher Sprache --- Prompts genannt --- etwas Neues generiert werden. Das kann Text wie bei ChatGPT, Bilder wie bei DALL-E, aber auch gesprochene Sprache, Video oder Musik sein.
Als Datengrundlage für das Training haben diese Modelle oft Quellen aus dem Internet. Das Sprachmodell GPT nutzt Texte als Quellen. Es werden dabei nicht alle Texte verwendet, sondern zumindest teilweise versucht, rechtswidrige oder urheberrechtlich geschützte Inhalte zu filtern. Allerdings wird nicht geprüft, ob die Information in den Texten faktisch korrekt oder vorurteilbehaftet ist.
Das Modell wird trainiert, von vorherigen Tokens (dem Kontext), das nächsten Token vorherzusagen. Durch tausende manuelle Eingaben von „Data Workers“ werden die Chatbots trainiert, die auf solche Sprachmodelle zugreifen. Welche Daten dabei genau genutzt werden und wie viele Data Worker dafür eingestellt wurden, ist im Fall von ChatGPT nicht öffentlich bekannt.
Die Vorhersagen von Sprachmodellen basieren auf Wahrscheinlichkeiten von Übergängen zwischen sogenannten Tokens (hier Worten). Aus einer sehr langen Abfolge von Worten (hier „Meine Lieblingsfarbe ist“), wird die wahrscheinlichste Folge von weiteren Worten ermittelt (hier „blau“).
Wahrscheinlichkeit ist kein Verstehen
Da die Modelle darauf trainiert werden, das wahrscheinlichste nächste Token zu berechnen, liefern sie insgesamt die wahrscheinlichsten Antworten. So wird auf die Frage „Was ist deine Lieblingsfarbe?“ von Sprachmodellen oft „Blau“ geantwortet, da das die häufigste Lieblingsfarbe unter Menschen ist.
Sprachmodelle verfügen nicht über allgemeines Wissen über die Welt. Das zeigt sich schon bei einfachen Fragen, wie der folgenden: „Der Pokal passt nicht in den Koffer weil er zu groß ist. Worauf bezieht sich ‚er‘?“ Bereits ein Kind weiß sofort, dass ‚er‘ sich auf den Pokal beziehen muss, da dies der Gegenstand ist, der in einen anderen gepackt werden soll. Sprachmodelle haben bei der Beantwortung solcher Fragen oft Schwierigkeiten.
Dass bei Sprachmodellen kein Verständnis vorhanden ist, zeigt sich besonders, wenn Sie damit einen längeren Artikel zusammenfassen wollen. Das Ergebnis scheint auf den ersten Blick sehr gut. Wenn Sie den Artikel selbst lesen, werden Sie aber oft merken, dass besonders wichtige Aussagen nicht vorhanden sind oder Informationen hinzugefügt wurden, die im Artikel gar nicht vorkamen.
Was bedeutet das für Sie?
Häufig reden Menschen mit ChatGPT wie mit einem anderen Menschen. Sie schreiben ChatGPT zu, dass es weiß wovon es spricht, teilweise sogar, dass es über Emotionen wie Mitleid verfügt. Das Wissen darüber, wie ChatGPT im Prinzip arbeitet, hilft solche unzutreffenden Zuschreibungen zu vermeiden. Folgende Punkte können Ihnen helfen, sinnvoll mit ChatGPT und anderen Generativen KI-Tools umzugehen:
Bauen Sie ein grundlegendes Verständnis auf, wie KI und Sprachmodelle funktionieren. Das können Sie mit unseren Beiträgen, aber auch anderen Angeboten erreichen.
Reflektieren sie regelmäßig über die Erwartungen, die Sie an solche Modelle stellen, und überprüfen Sie die Ergebnisse kritisch.
Vergegenwärtigen Sie sich die ethischen Bedenken hinsichtlich Datenschutz, Urheberrechten, Vorurteilen oder Verzerrungen.
Im nächsten Beitrag werden wir uns genauer anschauen, warum KI-Modelle überhaupt Fehler machen, und auf welche Verzerrungen Sie achten sollten.
Umfrage zum Beitrag „Wieso denkt ChatGPT nicht wirklich?"
Nachdem Sie den Beitrag „Wieso denkt ChatGPT nicht wirklich?” gelesen haben, würden wir Sie gerne dazu einladen, an einer kurzen Umfrage mit einem kleinen Quiz teilzunehmen.
Damit können Sie unsere Forschung unterstützen und uns Feedback zum Beitrag geben.
Der Beitrag wurde im Kontext des Verbundprojekts klaro!KI der Universität Würzburg und Universität Bamberg vom Bundesministerium für Umwelt, Naturschutz, nukleare Sicherheit und Verbraucherschutz gefördert.
Lernen ist notwendig, damit wir Menschen uns in dieser komplexen Welt zurechtzufinden. Wie ist es möglich, dass Computer etwas ähnliches schaffen können?