Schon Leonardo da Vinci war von Automatisierung fasziniert und konstruierte – vermutlich um 1478 – eine frühe Idee eines mechanisch programmierbaren Roboters, der sich selbst fortbewegen konnte. Es ist jedoch nicht bekannt, ob seine Idee jemals in einen funktionierenden Prototyp umgesetzt wurde. Mit Künstlicher Intelligenz (KI) hat die menschliche Fähigkeit, Probleme automatisiert zu lösen, neue Dimensionen erreicht.
Seit der Veröffentlichung von ChatGPT am 30.11.2022 ist ein regelrechter Hype um sogenannte Generative Künstliche Intelligenz (GKI) zu beobachten. Auch wenn die grundlegenden Algorithmen bereits seit über 50 Jahren in wissenschaftlichen Publikationen dokumentiert sind, brachte vor allem ChatGPT eine signifikante Veränderung: Es hat die Art und Weise revolutioniert, wie wir mit Maschinen interagieren, wobei der Fokus auf der Disziplin der Mensch-Maschinen-Interaktion liegt.
Die als Prompts bezeichneten Befehle nehmen teilweise nicht nur natürliche Sprache als Text oder Spracheingabe, sondern auch Dialekte und Fehler unbekümmert hin und überraschen mit erstaunlich kreativen und komplexen Ergebnissen. Beispiel: Welcher Halbton folgt auf f? Unrevidierte Antwort von ChatGPT: Der Halbton, der auf den Ton „F“ folgt, ist „Fis“ bzw. „Ges“. Es ist wichtig zu beachten, dass „Fis“ und „Ges“ enharmonische Verwechslungen sind, d.h. sie beziehen sich auf denselben Ton in der westlichen Musik, aber werden unterschiedlich benannt abhängig vom musikalischen Kontext.1
Nicht selten beobachtet man bei Erstnutzer*innen ein Deus-ex-Machina-Erlebnis, eine fast schon göttliche, allwissende Erscheinung der KI-Applikation. So lässt sich auch erklären, wieso es gerade einmal fünf Tage dauerte, bis ChatGPT eine Million Nutzer*innen zählte.
Definition Prompt-Engineering
Das Prompt-Engineering beschreibt die menschliche Problemlösungskompetenz, eine Generative Künstliche Intelligenz (GKI) mittels textueller Spracheingabe produktiv einzusetzen. Dabei handelt es sich zwar gewissermaßen um eine Programmiertätigkeit im Sinne einer Hochsprache, die neben menschlichen Ausdrücken auch Operanden, Syntax und plattformspezifische Befehle enthält. Jedoch macht die randomisierte Natur der GKI eine Vorhersage des Resultats nahezu unmöglich und erfordert eine iterative Arbeitsweise zwischen Mensch und KI, was für eine Deutung als kreative, schöpferische Tätigkeit spricht.
Längst ist in der akademischen Welt ein Diskurs darüber entbrannt, ob Prüfungen in den bisherigen Formen (Thesis, Hausarbeit etc.) überhaupt noch haltbar sind. Die Potenziale für Lehre und Forschung sind nicht von der Hand zu weisen, auch wenn dieser Artikel nur Ausschnitte mit Blick auf das wissenschaftliche Schreiben herausarbeiten kann und will.2
Die ungeheure Tragweite dieser neu verfügbaren Technologie, die weit über den Wikipedia-Moment vergangener Tage hinausgeht, ist mit Sicherheit noch weitreichend, interdisziplinär und global zu diskutieren. Doch schauen wir für den Moment einmal auf den kleinen Mikrokosmus des akademischen Schreibens und Revidierens hierzulande.
Was der Hype um ChatGPT für das wissenschaftliche Schreiben bedeutet
Betrachtet man nur den Bereich des wissenschaftlichen Schreibens im Zusammenhang mit Generativer Künstlicher Intelligenz, so fällt auf, dass die Angst vor Plagiaten zunimmt. Dafür gibt es in der Tat gute Gründe: Während mich das Schreiben dieses Artikels mit sicherlich zahlreichen Flüchtigkeitsfehlern einige Stunden kostet, könnte eine KI die gleiche Textmenge in wenigen Sekunden fehlerfrei produzieren. Blogs, Nachrichtenseiten und sogar Bücher werden mit automatisiert generierten Inhalten überschwemmt.
Hier ist ein größerer Diskurs auf der Ebene des Hochschulrechts, der Prüfungsordnungen, der zuständigen Ministerien und nicht zuletzt des Urheberrechts notwendig. Denn eines ist klar: Der Geist ist aus der Flasche. Plagiator*innen und Plagiatsjäger*innen werden sich unaufhaltsam mit den neusten technologischen Entwicklungen wappnen. Doch dies hat sich seit dem Wikipedia-Moment nicht wesentlich geändert: Als Wikipedia Teil unseres wissenschaftlichen Alltags wurde, mussten wir uns erst mit einer Funktionsweise und Datengrundlage auseinandersetzen.
Besonders die Frage der Vertrauenswürdigkeit stand im Vordergrund, da sich diese von traditionellen Peer-Review-Verfahren unterscheidet. Der Blick auf ChatGPT und seine Anverwandten (sogenannte Large Language Models) verheißt eine ähnliche Lernkurve: Inwieweit kann man Textgenerierungs-KIs vertrauen? Wie kann KI eingesetzt werden, um die oft trivialen und repetitiven Rechercheprozesse zu revolutionieren? Können wir schon heute KI einsetzen, um neue Erkenntnisse im Forschungs- und Schreibprozess zu gewinnen? Und wie können wir Studierende mit so viel digitaler Kompetenz ausstatten, dass ein verantwortungsvoller und zielführender Umgang mit KI in allen Disziplinen zur Grundlage gehört?
Um sich diesen Fragen sicher nähern zu können, müssen wir zunächst einige Hintergründe zu GKI im Allgemeinen und ChatGPT im Besonderen verstehen.
Einblicke in das Themenfeld Generative Künstliche Intelligenz
GPT ist die Abkürzung für Generative Pretrained Transformer. ChatGPT ist derzeit in der Version 4 verfügbar (nur in der kostenpflichtigen Version). Die Vorgängerversion (3.5), die derzeit noch kostenlos genutzt werden kann, wurde mit 175 Milliarden Parametern trainiert. In der Welt der KI spielen sogenannte Transformer eine wichtige Rolle: Sie bilden Wortkonstruktionen mathematisch als Vektoren ab und geben eine Wahrscheinlichkeit für die nächste Ausgabe an. So ließe sich der Satzanfang „Olaf Scholz ist“ zwar beliebig fortsetzen („Bundeskanzler“, „wurde im Cum-Ex-Skandal mehrfach befragt“ oder „ehemaliger Hamburger Bürgermeister“ und so weiter), aber hier wird schnell deutlich, dass unterschiedliche Fortsetzungen auch unterschiedliche Wahrscheinlichkeiten haben, je nachdem, wie häufig sie im Korpus der Internettexte vorkommen.
Hier lässt sich auch gleich eine aktuelle Einschränkung demonstrieren, denn ChatGPT vollzieht den Satz wie folgt nach: „Olaf Scholz ist ein deutscher Politiker und war von 2018 bis 2021 Bundesminister der Finanzen in Deutschland.“ Das Wissen von ChatGPT 3.5 wurde mit einem maximal aktuellen Datenstand von September 2021 trainiert. In GPT 4 ist dieses Problem bereits behoben, so dass die souveräne Antwort der KI schlicht lautet: „der Bundeskanzler der Bundesrepublik Deutschland“.
Neben ChatGPT, das derzeit führend in der Textgenerierung ist, gibt es natürlich noch andere Anbietende. Elicit beispielsweise ist darauf spezialisiert, wissenschaftliche Artikel zu einer Forschungsfrage zusammenzufassen. Das funktioniert erstaunlich gut und bietet eine solide Recherchehilfe. Perplexity und You beziehen zunächst mehr Quellen ein, lassen sich aber filtern und liefern auch funktionierende Links. Dies ist eine der aktuellen Schwächen von ChatGPT: Auch in der neuesten Version sehen die angeforderten Quellenangaben plausibel aus, sind aber regelmäßig frei erfunden.
Tipps zur Nutzung von ChatGPT & Co
Trotz der einladenden dialogbasierten Steuerung sind programmierähnliche Vorgehensweisen hilfreich, um bessere Ergebnisse in der Arbeit mit KI zu erzielen. Um bei der Formulierung von Prompts im wissenschaftlichen Umfeld nahe an den Fakten zu bleiben, ist es wichtig, der KI klare Vorgaben zu machen. Die folgende Übersicht bietet einige Prompts, die direkt in ChatGPT ausprobiert werden können. Eine abstrahierte Syntax für qualitativ hochwertige Prompts folgt dem Schema: [Rolle, aus der die KI agieren soll] + [Aufgabenbeschreibung] + [Restriktionen] + [Beispiel] + [Dateninput].
Der gesamte Artikel war, bis zu diesem Punkt, menschliche Handarbeit. Zu Demo-Zwecken bitte ich nun ChatGPT, ein Fazit zu generieren (Prompt: Du bist wissenschaftliche Autorin. Schreib mir ein Fazit in 350 Zeichen für untenstehenden Text, ende mit einem positiven Appell [Kopie des Manuskriptes einfügen]).
Fazit
Die Integration Generativer Künstlicher Intelligenz wie ChatGPT in den wissenschaftlichen Prozess revolutioniert Forschungs- und Schreibprozesse, bringt jedoch auch Herausforderungen in Bezug auf Plagiate mit sich.
Kategorie | Prompt-Bausteine |
Outline | Du bist Wissenschaftlerin in [Fachbereich]. Schreibe mir einen Outline-Entwurf zum [Thema] für eine literaturbasierte Seminararbeit. |
Zusammenfassen | Fasse nachfolgenden Text in wissenschaftlichem Stil zusammen. [Textinput] |
Forschungsfragen- Brainstorming | Du bist renommierte Forscherin in [Fachgebiet]. Lass uns ein Brainstorming zu neuen Forschungsfragen zu [Thema] entwickeln. Gib mir drei Ideen, die wir zum Einstieg diskutieren können. |
Datenauswertung | Du bist Data Scientist – nachfolgende Rohdaten enthalten Merkmale, Merkmalsausprägungen usw., ich möchte, dass Du diese CSV-Datei für mich strukturiert als Variablenübersicht darstellst. [CSV-Input] |
Ausblick | Du bist renommierte Forscherin in [Fachgebiet]. Schreibe einen Absatz zu [Thema] über den Ausblick in dem Themengebiet. |
Lektorieren | Du bist Lektorin für wissenschaftliches Schreiben. Gleiche den Schreibstil der nachfolgenden Texte an, korrigiere Orthografie und achte auf einen wissenschaftlichen Ausdruck. [Textinput] |
Supervision | Du bist meine Doktormutter, ich stelle Dir mein aktuelles Forschungsansinnen vor und Du gibst mir dazu kritisches Feedback. Gib mir jeweils nur einen Feedback-Punkt, damit ich dazu Stellung nehmen kann. |
Forschungs-Pipeline- Brainstorming | Du bist Wissenschaftlerin in [Forschungsbereich]. Hilf mir, meine Forschungspipeline in [Thema] aufzubauen. Es geht mir um die [Perspektive auf das Thema] unter Verwendung von [Methoden] und [weitere Perspektive auf das Thema]. Schlage mir drei Paper-Ideen vor, die aufeinander aufbauen, nenne jeweils zwei Forschungsfragen und begründe, warum die Idee Forschungsrelevanz und -aktualität besitzt. |
___
1 „Fis“ wird in Kontexten verwendet, in denen die Tonart oder die Skala einen erhöhten (oder „scharfen“) „F“-Ton erfordert, während „Ges“ in Kontexten verwendet wird, in denen die Tonart oder die Skala einen erniedrigten (oder „flachen“) „G“-Ton erfordert.
2 Die wohl umfassendste Stellungnahme bislang hierzu: Gimpel, Henner/Hall, Kristina/Decker, Stefan/ Eymann, Torsten/Lämmermann, Luis, Mädche, Alexander/Röglinger, Maximilian/Ruiner, Caroline/Schoch, Manfred/Schoop, Mareike/Urbach, Nils/Vandrik, Steffen (2023): Unlocking the Power of Generative AI Models and Systems such as GPT-4 and ChatGPT for Higher Education: A Guide for Students and Lecturers. University of Hohenheim.
***
Dieser Beitrag wurde erstmalig in der Exposé – Zeitschrift für wissenschaftliches Schreiben und Publizieren 2-2023 mit dem Schwerpunktthema „Digitale Innovationen“ veröffentlicht.
Der Autor: Nicolai Krüger
Prof. Dr. Nicolai Krüger forscht und lehrt als Professor für Wirtschaftsinformatik an der IU Düsseldorf mit besonderem Fokus auf Angewandte Künstliche Intelligenz. Er ist außerdem Gründer der pitchnext GmbH und Autor der Bücher „Künstliche Intelligenz in Training, Weiterbildung und Beratung“ sowie „Gründungsintelligenz“.
Alles über das Publizieren bei Budrich …
… erfahren Sie auf unserer Veröffentlichen-Seite.
© Titelbild: pexels.com | Shantanu Kumar; Bild Nicolai Krüger: privat