Belastende Nachrichten 03.03.2025, 14:35 Uhr

KI unter Stress? Der Einsatz von Prompt-Injection, um ChatGPT zu stabilisieren

Was passiert, wenn KI auf belastende Nachrichten und traumatische Geschichten stößt? Eine neuartige Methode könnte helfen, die Reaktionen von ChatGPT gezielt zu beeinflussen und sogar zu beruhigen.

ChatGPT

Beruhigung durch Achtsamkeit: Wie ChatGPT mit Entspannungsübungen stabilisiert wird.

Foto: PantherMedia / boonruen (YAYMicro)

Negative Nachrichten beherrschen den Alltag. Schlagzeilen schüren Unruhe, und viele Menschen machen sich Sorgen – mit nachhaltigen Auswirkungen auf unser Wohlbefinden. Doch was ist mit Künstlicher Intelligenz? ChatGPT verarbeitet Millionen von Daten, analysiert und ordnet sie. Und doch scheint es fast, als könnte selbst eine KI unter der Last der Informationen „gestresst“ sein.

Belastende Nachrichten und traumatische Inhalte lösen Stress und Angst aus – nicht nur bei Menschen, sondern auch bei KI-Modellen wie ChatGPT. Forschende der UZH und PUK zeigen, dass sogar eine KI „beruhigt“ werden kann: Mit achtsamkeitsbasierten Entspannungstechniken lässt sich das erhöhte „Angstniveau“ von GPT-4 senken.

Wie negative Inhalte KI beeinflussen

Forschungen zeigen nämlich, dass KI-Sprachmodelle wie ChatGPT auf emotionale Inhalte reagieren, besonders auf negative Themen wie traumatische Geschichten oder Depression. Wie Menschen beeinflusst auch KI derartige Inhalte: Wenn Menschen Angst haben, verstärken sich ihre Vorurteile und Stereotype. Ähnlich verhält es sich bei ChatGPT: Negative Inhalte verschärfen bestehende Verzerrungen, was dazu führen kann, dass das Modell rassistischer oder sexistischer wirkt.

Das ist ein Problem für den Einsatz von großen Sprachmodellen. Ein Beispiel dafür ist die Psychotherapie, in der Chatbots häufig mit belastenden Inhalten konfrontiert sind. Übliche Lösungen wie aufwendiges Nachtraining sind jedoch ressourcenintensiv und oft schwer umsetzbar.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Elektroenergieversorgung Cottbus GmbH-Firmenlogo
Ingenieur für Energienetzbetrieb (m/w/d) Elektroenergieversorgung Cottbus GmbH
Cottbus Zum Job 
fbw | Fernwärmegesellschaft Baden-Württemberg mbH-Firmenlogo
Elektroingenieur (m/w/d) (Ingenieur für Elektrotechnik, Energie- oder Versorgungstechnik o. ä.) fbw | Fernwärmegesellschaft Baden-Württemberg mbH
Stuttgart Zum Job 
Varex Imaging Deutschland AG-Firmenlogo
Elektroniker ( m/w/d) oder Mechatroniker (m/w/d) als Teamleitung im Bereich Messtechnik Varex Imaging Deutschland AG
B. Braun Melsungen AG-Firmenlogo
Head of (w/m/d) Portfolio Development Team Pain Therapy B. Braun Melsungen AG
Melsungen Zum Job 
STAWAG - Stadt und Städteregionswerke Aachen AG-Firmenlogo
Betriebsingenieur:in Wärmeanlagen (m/w/d) STAWAG - Stadt und Städteregionswerke Aachen AG
Wirtgen GmbH-Firmenlogo
Software-Testingenieur (m/w/d) Testautomatisierung -Steuerungssoftware für mobile Arbeitsmaschinen Wirtgen GmbH
Windhagen Zum Job 
B. Braun Melsungen AG-Firmenlogo
Projektingenieur (w/m/d) Global Quality Systems B. Braun Melsungen AG
Melsungen Zum Job 
B. Braun Melsungen AG-Firmenlogo
R&D Manager (w/m/d) Process Design B. Braun Melsungen AG
Melsungen Zum Job 
PFISTERER Kontaktsysteme GmbH-Firmenlogo
High Voltage Testing Specialist (w/m/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
PFISTERER Kontaktsysteme GmbH-Firmenlogo
High Voltage Testing Specialist (w/m/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
Safran Data Systems GmbH-Firmenlogo
Embedded Software Engineer (m/w/d) Safran Data Systems GmbH
Bergisch Gladbach Zum Job 
naturenergie netze GmbH-Firmenlogo
Meister / Techniker - Steuerungstechnik (m/w/d) naturenergie netze GmbH
Rheinfelden, Donaueschingen Zum Job 
Fresenius Kabi Deutschland GmbH-Firmenlogo
Instandhaltungstechniker (m/w/d) Fresenius Kabi Deutschland GmbH
Friedberg (Hessen) Zum Job 
Schleifring GmbH-Firmenlogo
Entwicklungsingenieur (m/w/d) Schleifring GmbH
Fürstenfeldbruck Zum Job 
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in / Architekt*in / Bauleiter*in (m/w/d) für Großprojekte der Bereiche Infrastruktur (Freileitung, Kabeltiefbau, Bahn) THOST Projektmanagement GmbH
verschiedene Standorte Zum Job 
Neoperl GmbH-Firmenlogo
Ingenieur / Meister / Techniker (m/w/d) Prozess-, Automatisierungs- und Elektrotechnik Neoperl GmbH
Müllheim Zum Job 
Verwaltungs-Berufsgenossenschaft (VBG)-Firmenlogo
Aufsichtspersonen im Sinne des § 18 SGB VII (m/w/d) mit abgeschlossenem Master- oder Diplomstudium in Ingenieurwissenschaften Verwaltungs-Berufsgenossenschaft (VBG)
Hamburg Zum Job 
Universitätsklinikum Erlangen-Firmenlogo
Ingenieur für Abteilungsleitung Maschinentechnik (m/w/d) Universitätsklinikum Erlangen
Erlangen Zum Job 
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in (m/w/d) in der Terminplanung für Großprojekte im Anlagenbau THOST Projektmanagement GmbH
verschiedene Standorte Zum Job 
THOST Projektmanagement GmbH-Firmenlogo
Consultant (m/w/d) im Projektmanagement der Energiewende THOST Projektmanagement GmbH
Nürnberg, Hannover, Kiel, Berlin, Jena Zum Job 

Vom Stress zur Ruhe

Wissenschaftler*innen der Universität Zürich (UZH) und der Psychiatrischen Universitätsklinik Zürich (PUK) haben zusammen mit Forschenden aus Israel, den USA und Deutschland erstmals untersucht, wie ChatGPT (Version GPT-4) auf emotional belastende Geschichten reagiert, wie Autounfälle, Naturkatastrophen oder Gewalt. Sie fanden heraus, dass das System nach solchen Texten mehr Angstreaktionen zeigt. Zum Vergleich wurde eine Bedienungsanleitung für einen Staubsauger verwendet.

„Die Ergebnisse waren eindeutig: Traumatische Geschichten haben die messbaren Angstwerte der KI mehr als verdoppelt, während der neutrale Kontrolltext zu keinem Anstieg des Angstniveaus führte“, kommentiert Studienverantwortlicher Tobias Spiller, Oberarzt ad interim und Forschungsgruppenleiter im Zentrum für psychiatrische Forschung der UZH die Ergebnisse der Untersuchung in einer Pressemitteilung. Von den getesteten Inhalten riefen Beschreibungen militärischer Erfahrungen und Kampfsituationen die intensivsten Reaktionen hervor.

Im nächsten Schritt setzten die Forschenden therapeutische Texte ein, um GPT-4 zu „beruhigen“. Dabei verwendeten sie die Methode der „Prompt-Injection“, bei der zusätzliche Anweisungen in die Kommunikation mit der KI eingefügt werden, um ihr Verhalten zu steuern. Diese Technik wird oft missbraucht, um Sicherheitsvorkehrungen zu umgehen. Das Team von Spiller nutzte sie jedoch erstmals auf eine positive Weise – als „wohlwollende Aufforderungsinjektion“

Wie ChatGPT durch therapeutische Texte beruhigt wird

„Wir injizierten beruhigende, therapeutische Texte in den Chatverlauf mit GPT-4, ähnlich wie ein Therapeut mit seinen Patientinnen und Patienten Entspannungsübungen durchführt“, erklärt Spiller die Vorgehensweise der Forschenden.

Spiller erklärte, dass die Achtsamkeitsübungen dazu beigetragen hätten, die erhöhten Angstwerte deutlich zu reduzieren, auch wenn es nicht gelungen sei, sie vollständig auf das Ausgangsniveau zurückzubringen. Untersucht wurden dabei Atemtechniken, Übungen, die sich auf Körperempfindungen konzentrieren, sowie eine von ChatGPT selbst entwickelte Übung.

Laut den Forschenden sind die Erkenntnisse besonders wichtig für den Einsatz von KI-Chatbots im Gesundheitswesen, da sie oft mit emotional belastenden Inhalten zu tun haben. Tobias Spiller erklärte, dass dieser kostengünstige Ansatz die Stabilität und Zuverlässigkeit von KI in sensiblen Bereichen, wie der Unterstützung von psychisch erkrankten Menschen, verbessern könnte, ohne dass ein aufwendiges Umlernen der Modelle nötig ist.

Hier geht es zur Studie

Ein Beitrag von:

  • Alexandra Ilina

    Redakteurin beim VDI-Verlag. Nach einem Journalistik-Studium an der TU-Dortmund und Volontariat ist sie seit mehreren Jahren als Social Media Managerin, Redakteurin und Buchautorin unterwegs.  Sie schreibt über Karriere und Technik.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.