Was KI-generierte Vogelgesänge über unser Gehirn verraten

Neue KI-Modelle analysieren Vogelgesang und liefern Einblicke in die Sprachverarbeitung des Gehirns. Könnten sie sogar die menschliche Sprache erklären?

Ein neu entwickeltes ChatGPT für Vogelgesang könnte Aufschluss darüber geben, wie Sprache im menschlichen Gehirn funktioniert.

Foto: PantherMedia / tareqsphotography

Forschende der Penn State University haben eine neue Modellierungsmethode entwickelt, die anhand von Vogelgesängen akkurate Sequenzen generiert. Die Erkenntnisse könnten helfen, die Neurobiologie hinter der Sprachverarbeitung besser zu verstehen. Dabei zeigt sich, dass die Struktur von Vogelgesängen Ähnlichkeiten zur menschlichen Sprache aufweist. Dies könnte wichtige Hinweise darauf liefern, wie unser Gehirn Sprache organisiert und verarbeitet.

KI und Vogelgesang: Einblicke in die Sprachverarbeitung
Kontextabhängigkeit: Ein zentrales Merkmal
Die Rolle des auditiven Feedbacks
Auswirkungen auf das Verständnis der menschlichen Sprache

KI und Vogelgesang: Einblicke in die Sprachverarbeitung

Wie können Vogelgesänge unser Verständnis der menschlichen Sprache erweitern? Das Forschungsteam ist dieser Frage mit einer neuen Methode zur Modellierung von Vogelgesängen nachgegangen. Sie analysierten die Gesänge Bengalischer Finken und entwickelten ein KI-gestütztes Modell, das die Sequenzen präzise nachbildet.

Die Ergebnisse könnten wertvolle Einblicke in die neuronalen Mechanismen liefern, die sowohl Vogelgesang als auch menschliche Sprache steuern. Laut Dezhe Jin, einem der Hauptautoren der Studie, bieten die strukturellen Gemeinsamkeiten von Vogelgesang und Sprache eine ideale Grundlage für weiterführende Forschungen: „Obwohl viel einfacher, sind die Sequenzen der Silben eines Vogelgesangs ähnlich wie die menschliche Sprache organisiert, sodass Vögel ein gutes Modell zur Erforschung der Neurobiologie der Sprache bieten.“

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs

Die Finken verwenden eine begrenzte Anzahl von Silbenkombinationen, um Melodien zu formen, ähnlich wie Menschen Wörter zu Sätzen anordnen. Die exakte Abfolge dieser Töne ist nicht zufällig, sondern folgt festen Mustern, die durch neuronale Prozesse gesteuert werden. Dabei zeigt sich, dass Vögel spezifische Regeln befolgen, die sich mit Prinzipien der menschlichen Grammatik vergleichen lassen.

Kontextabhängigkeit: Ein zentrales Merkmal

Eine der zentralen Erkenntnisse der Studie ist die sogenannte Kontextabhängigkeit. Bei der menschlichen Sprache beeinflussen bereits gesagte Wörter, wie ein Satz fortgesetzt wird. Ein Beispiel ist der Ausdruck „fliegt wie“. Er kann in verschiedenen Kontexten unterschiedliche Bedeutungen haben, etwa in „Die Zeit vergeht wie im Flug“ oder „Fruchtfliegen mögen Bananen“. Eine unsinnige Kombination wie „Die Zeit vergeht wie Bananen“ zeigt, dass Sprache bestimmten Regeln folgt.

Vögel weisen eine ähnliche Struktur in ihren Gesängen auf. Laut Jin zeigen Bengalische Finken ebenfalls kontextabhängige Sequenzen. Die Forschenden entwickelten ein spezielles statistisches Modell, um diese Abhängigkeit genauer zu untersuchen. Dabei verwendeten sie ein sogenanntes partiell beobachtbares Markov-Modell, das präzisere Vorhersagen ermöglicht als bisherige Ansätze.

Diese Modelle analysieren, mit welcher Wahrscheinlichkeit eine bestimmte Silbe auf eine andere folgt. Dabei werden verschiedene Möglichkeiten in einem Flussdiagramm dargestellt, das Alternativen aufzeigt. Grundlegende Markov-Modelle tendieren dazu, zu verallgemeinern und Sequenzen zu generieren, die in Wirklichkeit nicht existieren. Die neue Methode ermittelt jedoch das einfachste Modell, das gleichzeitig exakt die real gesungenen Sequenzen eines Vogels widerspiegelt.

Auch interessant:

Zoologisches Museum der Universität Cambridge

KI ermöglicht einen Plausch mit ausgestopften Schnabeltieren oder dem ausgestorbenen Dodo

Kommunikation der Zukunft

Wenn KI die Tiersprache entschlüsselt

KI-Simulation

Reise in die Zukunft: Haben Sie heute schon mit sich selbst gesprochen?

Die Rolle des auditiven Feedbacks

Ein entscheidender Faktor für die Entwicklung der Gesangsmuster scheint das auditive Feedback zu sein. Vögel hören sich selbst zu und passen ihre Gesänge entsprechend an. Um dies zu bestätigen, untersuchten die Forschenden Vögel, die nicht hören konnten. Das Ergebnis: Bei diesen Tieren nahm die Kontextabhängigkeit deutlich ab.

Jin erklärt: „Die Vögel hören sich selbst zu und passen ihren Gesang auf der Grundlage dessen, was sie hören, an. Die damit verbundene Maschinerie im Gehirn spielt wahrscheinlich eine Rolle bei der Kontextabhängigkeit.“ Dies deutet darauf hin, dass das Hören der eigenen Stimme essenziell ist, um die komplexen Sequenzmuster beizubehalten.

Zusätzlich gibt es Hinweise darauf, dass bestimmte Neuronengruppen mit bestimmten Silben verknüpft sind. Das bedeutet, dass unterschiedliche Gehirnregionen je nach gesungener Sequenz aktiviert werden. Dies ist eine Parallele zur menschlichen Sprachproduktion, bei der verschiedene Areale für Syntax, Semantik und Aussprache verantwortlich sind.

Auswirkungen auf das Verständnis der menschlichen Sprache

Die Forschenden sehen Parallelen zwischen der Sprachverarbeitung bei Menschen und den Gesängen der Vögel. Sie testeten ihre Modellierungsmethode sogar mit der englischen Sprache und konnten damit Texte generieren, die weitgehend grammatikalisch korrekt waren. Dies wirft spannende Fragen auf: Ist die menschliche Sprache wirklich so einzigartig, wie oft angenommen wird? Oder gibt es universelle Prinzipien, die sowohl bei Tieren als auch beim Menschen zur Anwendung kommen?

Laut Jin könnte das Modell in Zukunft nicht nur für die Analyse von Vogelgesängen genutzt werden, sondern auch für andere Tierlaute und komplexe Verhaltensmuster. „Wir haben diese Methode tatsächlich mit der englischen Sprache verwendet und konnten einen Text erzeugen, der größtenteils grammatikalisch korrekt ist,“ so Jin. „Vielleicht ist der zugrunde liegende neuronale Mechanismus von Vogelgesang und menschlicher Sprache ähnlicher, als wir bisher dachten.“

Hier geht es zur Originalpublikation

Ein Beitrag von:

Dominik Hochwarth

Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.