Smarte Elektronik 29.05.2024, 07:00 Uhr

Mit diesen Kopfhörern können Sie anderen Menschen lauschen

Ein amerikanisches Forschungsteam hat künstliche Intelligenz (KI) mit einem Noise-Cancelling-System vereint. Herausgekommen ist ein innovativer Kopfhörer – wer ihn trägt, kann entscheiden, wem er zuhören möchte.

Frau mit Kopfhörern

Ein neues Kopfhörer-System ermöglicht es, gezielt bestimmten Sprechern zu lauschen.

Foto: panthermedia.net/VikaOvcharenko

Kopfhörer mit Geräuschunterdrückung sind sehr praktisch, wenn man seine Ruhe haben will. Aber manchmal möchte man das gar nicht. Wer hat sich zum Beispiel nicht schon mal auf einer Konferenz gewünscht, das Gemurmel anderer Besucher ausblenden zu können, um den Vortragenden besser zu verstehen? Genau daran haben Wissenschaftler und Wissenschaftlerinnen von der University of Washington gearbeitet. Die Forschenden haben ein System entwickelt, das auf künstlicher Intelligenz basiert. Damit kann man als Kopfhörer-Nutzer eine Person, die gerade spricht, ein paar Sekunden lang beobachten. Dadurch wird die Person sozusagen „registriert“. Ab dann spielt das System nur noch die Stimme dieser einen Person ab – und zwar in Echtzeit. Egal, ob man sich in einer lauten Umgebung befindet oder den Sprecher oder die Sprecherin gar nicht mehr sieht.

„Wir neigen heute dazu, bei KI an webbasierte Chatbots zu denken, die Fragen beantworten“, sagte der Hauptautor der Studie Shyam Gollakota, ein Professor an der Paul G. Allen School of Computer Science & Engineering. Er fasst den Ansatz des Projektes zusammen „Wir entwickeln KI, um die Hörwahrnehmung von Kopfhörern zu verändern, je nach ihren Vorlieben. Mit unseren Geräten kann man nun einen einzelnen Sprecher klar und deutlich hören, auch wenn man sich in einer lauten Umgebung befindet, in der viele andere Menschen sprechen.“

So funktionieren die smarten Kopfhörer

Das ganze System nennt sich „Target Speech Hearing“, kurz TSH. Um das System zu nutzen, muss der Träger einfach nur einen Knopf an den Kopfhörern drücken, um die Sprecher-Erkennung zu aktivieren. Daraufhin dreht er den Kopf in Richtung des Sprechers. Seine Stimme sollte dann die Mikrofone auf beiden Seiten des Kopfhörers gleichzeitig erreichen.

Die Kopfhörer schicken das eingehende Signal an einen eingebauten Computer. Dort lernt die KI-Software dann die Stimmmuster des ausgewählten Sprechers. Das System merkt sich die Stimme und gibt sie dem Hörer wieder, auch wenn der Sprecher oder der Kopfhörer-Träger sich bewegen, es also keinen Sichtkontakt mehr gibt.

Stellenangebote im Bereich Elektrotechnik, Elektronik

Elektrotechnik, Elektronik Jobs
Octapharma Produktionsgesellschaft Deutschland mbH-Firmenlogo
Ingenieur (m/w/d) Automatisierung (Schwerpunkt: Prozessleitsystem PCS7) Octapharma Produktionsgesellschaft Deutschland mbH
Springe Zum Job 
BG ETEM-Firmenlogo
Aufsichtsperson I (m/w/d) nach § 18 SGB VII für die Region Rheine, Nordhorn und Lingen BG ETEM
Region Lingen, Rheine, Nordhorn Zum Job 
Nitto Advanced Film Gronau GmbH-Firmenlogo
Projektingenieur im Engineering (w/m/d) Nitto Advanced Film Gronau GmbH
Industriepark Nienburg GmbH-Firmenlogo
Ingenieur (m/w/d) Elektrotechnik als Leiter Elektrotechnik & Automation Industriepark Nienburg GmbH
Nienburg Zum Job 
Evonik Operations GmbH-Firmenlogo
EMR-Anlageningenieur (m/w/d) mit Sonderqualifikation Evonik Operations GmbH
Rheinfelden (Baden) Zum Job 
CR3-Kaffeeveredelung M. Hermsen GmbH-Firmenlogo
Projektleiter (m/w/d) Elektrotechnik CR3-Kaffeeveredelung M. Hermsen GmbH
THU Technische Hochschule Ulm-Firmenlogo
Laboringenieur*in (w/m/d) mit Leitungsfunktion am Institut für Automatisierungssysteme THU Technische Hochschule Ulm
Infraserv GmbH & Co. Höchst KG-Firmenlogo
Ingenieur Verfahrenstechnik / Mechatronik für Messstellenbetrieb Erdgas & rohrgebundene Medien (w/m/d) Infraserv GmbH & Co. Höchst KG
Frankfurt am Main Zum Job 
Zweckverband Bodensee-Wasserversorgung-Firmenlogo
Ingenieur (m/w/d) für Automatisierungstechnik SPS / OT-Sicherheit Zweckverband Bodensee-Wasserversorgung
Sipplingen Zum Job 
B. Braun Melsungen AG-Firmenlogo
Senior Prozess Experte (w/m/d) Reinmedien / Einwaage / Ansatz B. Braun Melsungen AG
Melsungen Zum Job 
Deutsches Zentrum für Luft- und Raumfahrt e. V.-Firmenlogo
Versorgungsingenieur/in, Elektroingenieur/in o. ä. (w/m/d) Projektsteuerung von Baumaßnahmen Deutsches Zentrum für Luft- und Raumfahrt e. V.
AGR Betriebsführung GmbH-Firmenlogo
Ingenieur Leittechnik (m/w/d) AGR Betriebsführung GmbH
Fresenius Kabi Deutschland GmbH-Firmenlogo
Automatisierungstechniker (m/w/d) Fresenius Kabi Deutschland GmbH
Friedberg (Hessen) Zum Job 
Siltronic AG-Firmenlogo
Ingenieur (m/w/d) Elektro- / Energietechnik Siltronic AG
Burghausen Zum Job 
Mack NC Engineering GmbH-Firmenlogo
Elektrokonstrukteur/SPS-Programmierer Automatisierungstechnik (m/w/d) Mack NC Engineering GmbH
Füssen Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Systemingenieur (m/w/i) für Oberflächeninspektion IMS Messsysteme GmbH
Heiligenhaus Zum Job 
Menlo Systems GmbH-Firmenlogo
Ingenieur / Physiker (m/w/d) für Service und Support Menlo Systems GmbH
Planegg Zum Job 
Elektroenergieversorgung Cottbus GmbH-Firmenlogo
Ingenieur für Energienetzbetrieb (m/w/d) Elektroenergieversorgung Cottbus GmbH
Cottbus Zum Job 
B. Braun Melsungen AG-Firmenlogo
Projektingenieur (w/m/d) Global Quality Systems B. Braun Melsungen AG
Melsungen Zum Job 
B. Braun Melsungen AG-Firmenlogo
R&D Manager (w/m/d) Process Design B. Braun Melsungen AG
Melsungen Zum Job 

Je länger der Sprecher redet, desto besser kann sich das System auf seine Stimme konzentrieren. Bei Tests mit 21 Probanden kam raus, dass die Stimme des registrierten Sprechers mit TSH fast doppelt so klar war wie ohne die Technologie.

Die Forschenden haben ihre Ergebnisse auf einer Konferenz in Honolulu vorgestellt. Den Code für das Proof-of-Concept-Gerät haben sie auch veröffentlicht, damit andere Ingenieure und Ingenieurinnen darauf aufbauen können. Kaufen können Endverbraucher die Kopfhörer mit TSH also noch nicht.

System für Kopfhörer, iPods und Hörgeräte

Die Forscher hatten vorher schon mal an einem ähnlichen System gearbeitet. Da konnten die Nutzenden bestimmte Geräuschklassen wie Vögel oder Stimmen auswählen, die sie hören wollten. Andere Geräusche wurden dann vollständig ausgeblendet. Die gezielte Sprecherauswahl ist der nächste Schritt. Hier soll aber noch lange nicht Schluss sein. Denn im Moment kann TSH nur einen Sprecher auf einmal registrieren. Und die Spracherkennung funktioniert nur, wenn keine andere laute Stimme aus der gleichen Richtung kommt – wer mit der Klangqualität nicht zufrieden ist, kann den Sprecher einfach nochmal neu registrieren.

Für die Zukunft will das Team das System für Ohrstöpsel und Hörgeräte anpassen. Dann könnten noch mehr Menschen von den smarten Kopfhörern profitieren. Finanziert wurde die Forschung übrigens durch verschiedene Preise und Stiftungen. Bis es die ersten smarten Kopfhörer mit Stimmerkennung im Laden gibt, wird es aber wohl noch ein bisschen dauern.

Ein Beitrag von:

  • Nicole Lücke

    Nicole Lücke macht Wissenschaftsjournalismus für Forschungszentren und Hochschulen, berichtet von medizinischen Fachkongressen und betreut Kundenmagazine für Energieversorger. Sie ist Gesellschafterin von Content Qualitäten. Ihre Themen: Energie, Technik, Nachhaltigkeit, Medizin/Medizintechnik.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.