Akustische Emotionserkennung 22.05.2024, 07:00 Uhr

Fast menschlich: Dieser Algorithmus versteht Sarkasmus

Die meisten Sprachmodelle und virtuelle Assistenten scheitern an sarkastischen Äußerungen. Ein Forschungsteam ist auf dem besten Weg, dieses Problem zu lösen. Das könnte das Sprachverständnis einer künstlichen Intelligenz (KI) auf eine neue Stufe heben.

Mann zeigt Gänsefüßchen

Gänsefüßchen in die Luft zu malen, ist eine bekannte Geste für Sarkasmus.

Foto: panthermedia.net/kristina_kokhanova (YAYMicro)

Es ist bekanntermaßen schwer, Sarkasmus durch Text zu vermitteln. Selbst im persönlichen Gespräch kann er leicht falsch interpretiert werden. Denn die subtilen Veränderungen im Tonfall, die Sarkasmus signalisieren, verwirren viele Menschen – und die meisten Computeralgorithmen. Dies schränkt die Leistungsfähigkeit der virtuellen Assistenten und Inhaltsanalysetools natürlich erheblich ein. Forschende haben nun einen multimodalen Algorithmus entwickelt, der mehrere Aspekte von Audioaufnahmen untersucht, um Sarkasmus besser zu erkennen und die Genauigkeit zu erhöhen.

„Sarkasmus ist die niedrigste Form des Witzes, aber die höchste Form der Intelligenz“, sagte einst der britische Schriftsteller Oscar Wilde. Für Algorithmen stellt er daher eine besondere Herausforderung dar. Xiyuan Gao, Shekhar Nayak und Matt Coler vom Speech Technology Lab an der Universität Groningen, Campus Fryslân, haben jetzt einen multimodalen Algorithmus entwickelt. Dieser untersucht verschiedene Aspekte von Audioaufnahmen, um Sarkasmus präziser zu erkennen und die Genauigkeit zu steigern. Gao hat die Arbeit auf einer gemeinsamen Tagung der Acoustical Society of America und der Canadian Acoustical Association in Ottawa, Kanada, präsentiert.

Kombination von Text- und Audio-Analyse im Algorithmus

Herkömmliche Algorithmen zur Sarkasmus-Erkennung stützen sich oft nur auf einen einzigen Parameter, um Ergebnisse zu erzielen. Dies ist der Hauptgrund für ihre häufig unzureichende Leistung. Gao, Nayak und Coler setzten stattdessen auf zwei komplementäre Ansätze: die Stimmungsanalyse anhand von Text und die Emotionserkennung anhand von Audio. So wollten sie ein umfassenderes Bild der gehörten Rede gewinnen.

So funktioniert ihr Ansatz im Detail: „Wir haben akustische Parameter wie Tonhöhe, Sprechgeschwindigkeit und Energie aus der Sprache extrahiert und dann die automatische Spracherkennung verwendet, um die Sprache in Text für die Stimmungsanalyse zu transkribieren“, erklärt Gao. „Anschließend haben wir jedem Sprachsegment Emoticons zugeordnet, die den emotionalen Inhalt widerspiegeln. Durch die Integration dieser multimodalen Hinweise in einen Algorithmus für maschinelles Lernen nutzt unser Ansatz die kombinierten Stärken von auditiven und textuellen Informationen zusammen mit Emoticons für eine umfassende Analyse.“

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
Jauss HR-Consulting GmbH & Co. KG-Firmenlogo
Automatisierungstechniker / Ingenieur / Techniker (m/w/d) TIA-Programmierung & Inbetriebnahme - Baustoffanlagenbau Jauss HR-Consulting GmbH & Co. KG
Raum Würzburg Zum Job 
Helmholtz-Zentrum Hereon-Firmenlogo
Systementwicklungsingenieurin (m/w/d) für Mess- und Steuerungssystemen Helmholtz-Zentrum Hereon
Geesthacht (bei Hamburg) Zum Job 
Motherson Group-Firmenlogo
Hardware Architect - Automotive (m/f/d) Motherson Group
Stuttgart Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Entwicklungsingenieur (m/w/i) Systemsoftware IMS Messsysteme GmbH
Heiligenhaus Zum Job 
Drägerwerk AG & Co. KGaA-Firmenlogo
Ingenieur / Specialist (m/w/d) Software und Datenkommunikation Drägerwerk AG & Co. KGaA
Lübeck Zum Job 
ESFORIN SE-Firmenlogo
Mitarbeiter*in Marktkommunikation & Prozesse (m/w/d) ESFORIN SE
FCP Ingenieure Deutschland GmbH-Firmenlogo
BIM-Modeller (m/w/d) FCP Ingenieure Deutschland GmbH
Deutsches Elektronen-Synchrotron DESY-Firmenlogo
Bauingenieurin als Bauinformatikerin (m/w/d) für die Einführung von Revit Deutsches Elektronen-Synchrotron DESY
Hamburg Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Geoinformatiker (w/m/d) Die Autobahn GmbH des Bundes
Hannover Zum Job 
Bundesamt für Bauwesen und Raumordnung (BBR)-Firmenlogo
Referentin / Referent (w/m/d) in der Kompetenzstelle BIM Bundesamt für Bauwesen und Raumordnung (BBR)
Bonn, Berlin Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Senior (w/m/d) BIM Consultant Die Autobahn GmbH des Bundes
Mehrer Compression GmbH-Firmenlogo
Ingenieur für Elektrotechnik (m/w/d) Mehrer Compression GmbH
Balingen Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Technical University of Munich (TUM) / Fraunhofer Institute for Applied and Integrated Security AISEC-Firmenlogo
Full Professor in Software & System Security in combination with the Institute Director at Fraunhofer Aisec Technical University of Munich (TUM) / Fraunhofer Institute for Applied and Integrated Security AISEC
München, Garching Zum Job 
Hochschule Angewandte Wissenschaften München-Firmenlogo
Professur für Data und Knowledge Engineering (W2) Hochschule Angewandte Wissenschaften München
München Zum Job 
THD - Technische Hochschule Deggendorf-Firmenlogo
Professorin / Professor (m/w/d) für das Lehrgebiet "Informatik" THD - Technische Hochschule Deggendorf
Deggendorf Zum Job 
THD - Technische Hochschule Deggendorf-Firmenlogo
Professorin / Professor (m/w/d) für das Lehrgebiet "Informatik" THD - Technische Hochschule Deggendorf
Deggendorf Zum Job 
Hochschule Heilbronn-Firmenlogo
Professur für künstliche Intelligenz in industriellen Systemen Hochschule Heilbronn
Künzelsau, Heilbronn, Schwäbisch Hall Zum Job 
DFS Deutsche Flugsicherung GmbH-Firmenlogo
Referent (m/w/d) Anforderungsmanagement Funktionale Systeme DFS Deutsche Flugsicherung GmbH
DNV GL SE-Firmenlogo
(Senior) Consultant for Digital System Operation (m/w/d) DNV GL SE
Dresden, Schönefeld Zum Job 
Jauss HR-Consulting GmbH & Co. KG-Firmenlogo
Automatisierungstechniker / Ingenieur / Techniker (m/w/d) TIA-Programmierung & Inbetriebnahme - Baustoffanlagenbau Jauss HR-Consulting GmbH & Co. KG
Raum Würzburg Zum Job 
Helmholtz-Zentrum Hereon-Firmenlogo
Systementwicklungsingenieurin (m/w/d) für Mess- und Steuerungssystemen Helmholtz-Zentrum Hereon
Geesthacht (bei Hamburg) Zum Job 
Motherson Group-Firmenlogo
Hardware Architect - Automotive (m/f/d) Motherson Group
Stuttgart Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Entwicklungsingenieur (m/w/i) Systemsoftware IMS Messsysteme GmbH
Heiligenhaus Zum Job 

Vielfältige Anwendungsmöglichkeiten des Sarkasmus-Algorithmus

Dieser Ansatz kann für mehr als nur die Erkennung eines trockenen Witzes verwendet werden. Die Wissenschaftler und Wissenschaftlerinnen betonen die breiten Einsatzmöglichkeiten dieser Technik in vielen Bereichen. „Die Entwicklung einer Technologie zur Erkennung von Sarkasmus kann auch anderen Forschungsbereichen zugutekommen, die sich mit der Analyse von Gefühlen und der Erkennung von Emotionen befassen“, erklärt Gao. „Traditionell konzentriert sich die Stimmungsanalyse hauptsächlich auf Text und wird für Anwendungen wie die Erkennung von Hassreden im Internet und die Ermittlung von Kundenmeinungen entwickelt.“

Die Emotionserkennung auf der Grundlage von Sprache könne aber beispielsweise auch in der KI-gestützten Gesundheitsfürsorge eingesetzt werden. „Eine Technologie zur Erkennung von Sarkasmus, die einen multimodalen Ansatz verfolgt, ist für diese Forschungsbereiche von großem Wert“, ist Gao überzeugt.

Das Team ist mit der Leistung des Algorithmus bereits zufrieden, sucht aber trotzdem nach Möglichkeiten, um ihn weiter zu verbessern. „Es gibt eine Reihe von Ausdrücken und Gesten, die Menschen verwenden, um sarkastische Elemente in der Sprache hervorzuheben“, sagt Gao. „Diese müssen noch besser in unser Projekt integriert werden. Außerdem würden wir gerne mehr Sprachen einbeziehen und Techniken zur Erkennung von Sarkasmus entwickeln.“ Im besten Fall könnte dabei ein Algorithmus entstehen, der tatsächlich die feinen Zwischentöne der Sprache erkennt – fast wie ein Mensch.

Ein Beitrag von:

  • Nicole Lücke

    Nicole Lücke macht Wissenschaftsjournalismus für Forschungszentren und Hochschulen, berichtet von medizinischen Fachkongressen und betreut Kundenmagazine für Energieversorger. Sie ist Gesellschafterin von Content Qualitäten. Ihre Themen: Energie, Technik, Nachhaltigkeit, Medizin/Medizintechnik.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.