Was bedeutet ChatGPT für das wissenschaftliche Schreiben?

Fra nutzt ChatGPT

Schon Leonardo da Vinci war von Automatisierung fas­ziniert und konstruierte – vermutlich um 1478 – eine frühe Idee eines mechanisch programmierbaren Robo­ters, der sich selbst fortbewegen konnte. Es ist jedoch nicht bekannt, ob seine Idee jemals in einen funktio­nierenden Prototyp umgesetzt wurde. Mit Künstlicher Intelligenz (KI) hat die menschliche Fähigkeit, Probleme automatisiert zu lösen, neue Dimensionen erreicht.

Seit der Veröffentlichung von ChatGPT am 30.11.2022 ist ein regelrechter Hype um sogenannte Generative Künstliche Intelligenz (GKI) zu beobachten. Auch wenn die grund­legenden Algorithmen bereits seit über 50 Jahren in wis­senschaftlichen Publikationen dokumentiert sind, brach­te vor allem ChatGPT eine signifikante Veränderung: Es hat die Art und Weise revolutioniert, wie wir mit Maschi­nen interagieren, wobei der Fokus auf der Disziplin der Mensch-Maschinen-Interaktion liegt.

Die als Prompts bezeichneten Befehle nehmen teilweise nicht nur natür­liche Sprache als Text oder Spracheingabe, sondern auch Dialekte und Fehler unbekümmert hin und überraschen mit erstaunlich kreativen und komplexen Ergebnissen. Beispiel: Welcher Halbton folgt auf f? Unrevidierte Ant­wort von ChatGPT: Der Halbton, der auf den Ton „F“ folgt, ist „Fis“ bzw. „Ges“. Es ist wichtig zu beachten, dass „Fis“ und „Ges“ enharmonische Verwechslungen sind, d.h. sie beziehen sich auf denselben Ton in der westlichen Mu­sik, aber werden unterschiedlich benannt abhängig vom musikalischen Kontext.1

Nicht selten beobachtet man bei Erstnutzer*innen ein Deus-ex-Machina-Erlebnis, eine fast schon göttliche, allwissende Erscheinung der KI-Applika­tion. So lässt sich auch erklären, wieso es gerade einmal fünf Tage dauerte, bis ChatGPT eine Million Nutzer*innen zählte.

 

Definition Prompt-Engineering

Das Prompt-Engineering beschreibt die menschliche Problemlösungskompetenz, eine Generative Künstli­che Intelligenz (GKI) mittels textueller Spracheingabe produktiv einzusetzen. Dabei handelt es sich zwar ge­wissermaßen um eine Programmiertätigkeit im Sinne einer Hochsprache, die neben menschlichen Ausdrü­cken auch Operanden, Syntax und plattformspezifi­sche Befehle enthält. Jedoch macht die randomisierte Natur der GKI eine Vorhersage des Resultats nahezu unmöglich und erfordert eine iterative Arbeitsweise zwischen Mensch und KI, was für eine Deutung als kreative, schöpferische Tätigkeit spricht.

Längst ist in der akademischen Welt ein Diskurs darü­ber entbrannt, ob Prüfungen in den bisherigen Formen (Thesis, Hausarbeit etc.) überhaupt noch haltbar sind. Die Potenziale für Lehre und Forschung sind nicht von der Hand zu weisen, auch wenn dieser Artikel nur Aus­schnitte mit Blick auf das wissenschaftliche Schreiben herausarbeiten kann und will.2

Die ungeheure Tragweite dieser neu verfügbaren Technologie, die weit über den Wikipedia-Moment vergangener Tage hinausgeht, ist mit Sicherheit noch weitreichend, interdisziplinär und global zu diskutieren. Doch schauen wir für den Moment einmal auf den kleinen Mikrokosmus des akademischen Schrei­bens und Revidierens hierzulande.

 

Was der Hype um ChatGPT für das wissenschaftliche Schreiben bedeutet

Betrachtet man nur den Bereich des wissenschaftlichen Schreibens im Zusammenhang mit Generativer Künstli­cher Intelligenz, so fällt auf, dass die Angst vor Plagiaten zunimmt. Dafür gibt es in der Tat gute Gründe: Während mich das Schreiben dieses Artikels mit sicherlich zahlrei­chen Flüchtigkeitsfehlern einige Stunden kostet, könn­te eine KI die gleiche Textmenge in wenigen Sekunden fehlerfrei produzieren. Blogs, Nachrichtenseiten und sogar Bücher werden mit automatisiert generierten In­halten überschwemmt.

Hier ist ein größerer Diskurs auf der Ebene des Hochschulrechts, der Prüfungsordnun­gen, der zuständigen Ministerien und nicht zuletzt des Urheberrechts notwendig. Denn eines ist klar: Der Geist ist aus der Flasche. Plagiator*innen und Plagiatsjäger*in­nen werden sich unaufhaltsam mit den neusten techno­logischen Entwicklungen wappnen. Doch dies hat sich seit dem Wikipedia-Moment nicht wesentlich geändert: Als Wikipedia Teil unseres wissenschaftlichen Alltags wurde, mussten wir uns erst mit einer Funktionsweise und Datengrundlage auseinandersetzen.

Besonders die Frage der Vertrauenswürdigkeit stand im Vordergrund, da sich diese von traditionellen Peer-Review-Verfahren unterscheidet. Der Blick auf ChatGPT und seine Anver­wandten (sogenannte Large Language Models) verheißt eine ähnliche Lernkurve: Inwieweit kann man Textgene­rierungs-KIs vertrauen? Wie kann KI eingesetzt werden, um die oft trivialen und repetitiven Rechercheprozesse zu revolutionieren? Können wir schon heute KI einset­zen, um neue Erkenntnisse im Forschungs- und Schreib­prozess zu gewinnen? Und wie können wir Studierende mit so viel digitaler Kompetenz ausstatten, dass ein ver­antwortungsvoller und zielführender Umgang mit KI in allen Disziplinen zur Grundlage gehört?

Um sich diesen Fragen sicher nähern zu können, müssen wir zunächst ei­nige Hintergründe zu GKI im Allgemeinen und ChatGPT im Besonderen verstehen.

 

Einblicke in das Themenfeld Generative Künstliche Intelligenz

GPT ist die Abkürzung für Generative Pretrained Trans­former. ChatGPT ist derzeit in der Version 4 verfügbar (nur in der kostenpflichtigen Version). Die Vorgänger­version (3.5), die derzeit noch kostenlos genutzt werden kann, wurde mit 175 Milliarden Parametern trainiert. In der Welt der KI spielen sogenannte Transformer eine wichtige Rolle: Sie bilden Wortkonstruktionen mathema­tisch als Vektoren ab und geben eine Wahrscheinlichkeit für die nächste Ausgabe an. So ließe sich der Satzanfang „Olaf Scholz ist“ zwar beliebig fortsetzen („Bundeskanz­ler“, „wurde im Cum-Ex-Skandal mehrfach befragt“ oder „ehemaliger Hamburger Bürgermeister“ und so weiter), aber hier wird schnell deutlich, dass unterschiedliche Fortsetzungen auch unterschiedliche Wahrscheinlichkei­ten haben, je nachdem, wie häufig sie im Korpus der In­ternettexte vorkommen.

Hier lässt sich auch gleich eine aktuelle Einschränkung demonstrieren, denn ChatGPT vollzieht den Satz wie folgt nach: „Olaf Scholz ist ein deutscher Politiker und war von 2018 bis 2021 Bundes­minister der Finanzen in Deutschland.“ Das Wissen von ChatGPT 3.5 wurde mit einem maximal aktuellen Daten­stand von September 2021 trainiert. In GPT 4 ist dieses Problem bereits behoben, so dass die souveräne Ant­wort der KI schlicht lautet: „der Bundeskanzler der Bun­desrepublik Deutschland“.

Neben ChatGPT, das derzeit führend in der Textgenerie­rung ist, gibt es natürlich noch andere Anbietende. Elicit beispielsweise ist darauf spezialisiert, wissenschaftliche Artikel zu einer Forschungsfrage zusammenzufassen. Das funktioniert erstaunlich gut und bietet eine solide Recherchehilfe. Perplexity und You beziehen zunächst mehr Quellen ein, lassen sich aber filtern und liefern auch funktionierende Links. Dies ist eine der aktuellen Schwä­chen von ChatGPT: Auch in der neuesten Version sehen die angeforderten Quellenangaben plausibel aus, sind aber regelmäßig frei erfunden.

 

Tipps zur Nutzung von ChatGPT & Co

Trotz der einladenden dialogbasierten Steuerung sind programmierähnliche Vorgehensweisen hilfreich, um bessere Ergebnisse in der Arbeit mit KI zu erzielen. Um bei der Formulierung von Prompts im wissenschaftlichen Umfeld nahe an den Fakten zu bleiben, ist es wichtig, der KI klare Vorgaben zu machen. Die folgende Übersicht bietet einige Prompts, die direkt in ChatGPT ausprobiert werden können. Eine abstrahierte Syntax für qualitativ hochwertige Prompts folgt dem Schema: [Rolle, aus der die KI agieren soll] + [Aufgabenbeschreibung] + [Restrik­tionen] + [Beispiel] + [Dateninput].

Der gesamte Artikel war, bis zu diesem Punkt, mensch­liche Handarbeit. Zu Demo-Zwecken bitte ich nun ChatGPT, ein Fazit zu generieren (Prompt: Du bist wissen­schaftliche Autorin. Schreib mir ein Fazit in 350 Zeichen für untenstehenden Text, ende mit einem positiven Ap­pell [Kopie des Manuskriptes einfügen]).

 

Fazit

Die Integration Generativer Künstlicher Intelligenz wie ChatGPT in den wissenschaftlichen Prozess revolutio­niert Forschungs- und Schreibprozesse, bringt jedoch auch Herausforderungen in Bezug auf Plagiate mit sich.

Kategorie Prompt-Bausteine
Outline Du bist Wissenschaftlerin in [Fachbereich]. Schreibe mir einen Outline-Entwurf zum [Thema] für eine literaturbasierte Seminararbeit.
Zusammenfassen Fasse nachfolgenden Text in wissenschaftlichem Stil zusammen. [Textinput]
Forschungsfragen- Brainstorming Du bist renommierte Forscherin in [Fachgebiet]. Lass uns ein Brainstorming zu neuen Forschungsfragen zu [Thema] entwickeln. Gib mir drei Ideen, die wir zum Einstieg diskutieren können.
Datenauswertung Du bist Data Scientist – nachfolgende Rohdaten enthalten Merkmale, Merkmalsausprägungen usw., ich möchte, dass Du diese CSV-Datei für mich strukturiert als Variablenübersicht darstellst. [CSV-Input]
Ausblick Du bist renommierte Forscherin in [Fachgebiet]. Schreibe einen Absatz zu [Thema] über den Ausblick in dem Themen­gebiet.
Lektorieren Du bist Lektorin für wissenschaftliches Schreiben. Gleiche den Schreibstil der nachfolgenden Texte an, korrigiere Ortho­grafie und achte auf einen wissenschaftlichen Ausdruck. [Textinput]
Supervision Du bist meine Doktormutter, ich stelle Dir mein aktuelles Forschungsansinnen vor und Du gibst mir dazu kritisches Feedback. Gib mir jeweils nur einen Feedback-Punkt, damit ich dazu Stellung nehmen kann.
Forschungs-Pipeline- Brainstorming Du bist Wissenschaftlerin in [Forschungsbereich]. Hilf mir, meine Forschungspipeline in [Thema] aufzubauen. Es geht mir um die [Perspektive auf das Thema] unter Verwendung von [Methoden] und [weitere Perspektive auf das Thema]. Schlage mir drei Paper-Ideen vor, die aufeinander aufbauen, nenne jeweils zwei Forschungsfragen und begründe, war­um die Idee Forschungsrelevanz und -aktualität besitzt.

___

1 „Fis“ wird in Kontexten verwendet, in denen die Tonart oder die Ska­la einen erhöhten (oder „scharfen“) „F“-Ton erfordert, während „Ges“ in Kontexten verwendet wird, in denen die Tonart oder die Skala einen erniedrigten (oder „flachen“) „G“-Ton erfordert.

2 Die wohl umfassendste Stellungnahme bislang hierzu: Gimpel, Henner/Hall, Kristina/Decker, Stefan/ Eymann, Torsten/Lämmer­mann, Luis, Mädche, Alexander/Röglinger, Maximilian/Ruiner, Ca­roline/Schoch, Manfred/Schoop, Mareike/Urbach, Nils/Vandrik, Steffen (2023): Unlocking the Power of Generative AI Models and Systems such as GPT-4 and ChatGPT for Higher Education: A Guide for Students and Lecturers. University of Hohenheim.

***

Dieser Beitrag wurde erstmalig in der Exposé – Zeitschrift für wissenschaftliches Schreiben und Publizieren 2-2023 mit dem Schwerpunktthema „Digitale Innovationen“ veröffentlicht.

 

Der Autor: Nicolai Krüger

Nicolai KrügerProf. Dr. Nicolai Krüger forscht und lehrt als Professor für Wirtschaftsinformatik an der IU Düsseldorf mit besonderem Fokus auf Angewandte Künstliche Intelligenz. Er ist außerdem Gründer der pitchnext GmbH und Autor der Bücher „Künstliche Intelligenz in Training, Weiterbildung und Beratung“ sowie „Gründungsintelligenz“.

 

 

 

Alles über das Publizieren bei Budrich …

Vorschau-Pursuit F21 Glühbirne… erfahren Sie auf unserer Veröffentlichen-Seite.

 

 

© Titelbild: pexels.com | Shantanu Kumar; Bild Nicolai Krüger: privat