KI und Robotik 05.06.2024, 07:00 Uhr

Mit dieser Technik werden Roboter viel intelligenter

Forschende des MIT haben eine Technik entwickelt, die Robotikdaten aus unterschiedlichen Quellen mittels generativer KI sinnvoll kombiniert. Entsprechend trainierte Roboter setzten Werkzeuge wie Hammer, Schraubenzieher und Spachtel effektiver ein. Die Roboterleistung verbesserte sich um satte 20 Prozent – in Simulation und Praxis gleichermaßen.

Schraubender Roboter Schraube in Oberfläche

Eine spezielle KI macht Roboter intelligenter.

Moderne Roboter sollen vielseitig sein und schnell neue Aufgaben lernen, damit sie zum Beispiel in der Lage sind, Reparaturen im Haus mit verschiedenen Werkzeugen durchzuführen. Dazu brauchen sie eine große Menge an Trainingsdaten, um den Werkzeuggebrauch zu lernen. Das Problem dabei: Vorhandene Datensätze sind je nach Anwendung und Umgebung sehr unterschiedlich: Farbbilder, taktile Parameter, Simulationen oder menschliche Demos – die Vielfalt der Daten erschwert das gezielte Training der Roboter.

Aus diesem Grund greifen viele Trainingsmethoden nur auf eine oder wenige Arten von Daten zurück. Der Nachteil: Die Roboter werden gut und spezifisch auf bestimmte Aufgaben trainiert, scheitern jedoch oft an neuen Aufgaben in unbekannten Umgebungen. Forschende des Massachusetts Institute of Technology (MIT) haben nun einen Weg gefunden, Daten aus vielen Quellen sinnvoll zu kombinieren. So können sie “einfache” Roboter zu Mehrzweck-Robotern ausbilden, die verschiedene Werkzeuge besser einsetzen können.

KI-Modelle lernen aus verschiedenen Datensätzen

Die Wissenschaftlerinnen und Wissenschaftler setzten in ihrem Ansatz auf sogenannte Diffusionsmodelle, eine bestimmte Form von generativer künstlicher Intelligenz (KI). Für jeden Datensatz trainierten sie ein separates Diffusionsmodell, das eine Strategie für eine bestimmte Aufgabe lernt. Anschließend kombinierten sie die erlernten Strategien zu einer allgemeinen Strategie. Durch dieses Vorgehen können Roboter verschiedene Aufgaben (besser) in unterschiedlichen Umgebungen ausführen.

„Der Umgang mit der Heterogenität von Roboterdatensätzen ist wie das bekannte Henne-Ei-Problem. Wenn wir viele Daten zum Trainieren allgemeiner Strategien verwenden wollen, brauchen wir zunächst einsatzfähige Roboter, um all diese Daten zu gewinnen. Ich denke, dass die Nutzung aller verfügbaren heterogenen Daten, ähnlich wie es die Forschenden mit ChatGPT getan haben, auch ein wichtiger Schritt für die Robotik ist“, sagt Lirui Wang, Hauptautorin des Artikels.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Netzgesellschaft Potsdam GmbH-Firmenlogo
Projektingenieur (m/w/d) Energietechnik - Umspannwerke/Hochspannungsfreileitung - Netzgesellschaft Potsdam GmbH
Potsdam Zum Job 
Albtal-Verkehrs-Gesellschaft mbH-Firmenlogo
Projektleiter*in Elektrotechnik Verkehrsanlagen (m/w/d) Elektroingenieur*in oder Techniker*in Albtal-Verkehrs-Gesellschaft mbH
Karlsruhe Zum Job 
Die Autobahn GmbH des Bundes Niederlassung Nordbayern-Firmenlogo
Ingenieur Elektrotechnik / Bauingenieur (w/m/d) Ladeinfrastruktur Die Autobahn GmbH des Bundes Niederlassung Nordbayern
Nürnberg Zum Job 
Bayerisches Staatsministerium für Wohnen, Bau und Verkehr-Firmenlogo
Traineeprogramm - Bachelor Fachrichtung Maschinenbau / Energie- und Gebäudetechnik (m/w/d) Bayerisches Staatsministerium für Wohnen, Bau und Verkehr
bayernweit Zum Job 
Bayerisches Staatsministerium für Wohnen, Bau und Verkehr-Firmenlogo
Traineeprogramm - Bachelor Fachrichtung Maschinenbau / Energie- und Gebäudetechnik (m/w/d) Bayerisches Staatsministerium für Wohnen, Bau und Verkehr
Nord-Micro GmbH & Co. OHGa part of Collins Aerospace-Firmenlogo
Projekt- / Produktingenieur (m/w/d) Nord-Micro GmbH & Co. OHGa part of Collins Aerospace
Frankfurt am Main Zum Job 
Fresenius Kabi-Firmenlogo
Instandhalter (m/w/d) Prozesstechnik - API Herstellung Fischöl Fresenius Kabi
Friedberg (Hessen) Zum Job 
B. Braun Melsungen AG-Firmenlogo
Project Manager (w/m/d) Pre-Development B. Braun Melsungen AG
Melsungen Zum Job 
Hamburger Stadtentwässerung AöR ein Unternehmen von HAMBURG WASSER-Firmenlogo
Ingenieur (m/w/d) Elektrotechnik als Projektleiter Hamburger Stadtentwässerung AöR ein Unternehmen von HAMBURG WASSER
Hamburg Zum Job 
THOST Projektmanagement GmbH-Firmenlogo
Wirtschaftsjurist*in / Ingenieur*in (m/w/d) für Contract & Claimsmanagement in Projektender Energiewende THOST Projektmanagement GmbH
Stuttgart, Mannheim Zum Job 
RES Deutschland GmbH-Firmenlogo
Head of Engineering / Leitung technische Planung Wind- & Solarparks (m/w/d) RES Deutschland GmbH
Vörstetten Zum Job 
MEWA Textil-Service SE & Co. Management OHG-Firmenlogo
Projektmanager (m/w/d) PMO Business Transformation MEWA Textil-Service SE & Co. Management OHG
Wiesbaden Zum Job 
MEWA Textil-Service SE & Co. Management OHG-Firmenlogo
Projektingenieur (m/w/d) Elektrotechnik MEWA Textil-Service SE & Co. Management OHG
Wiesbaden Zum Job 
KÜBLER GmbH-Firmenlogo
Techniker / Ingenieur / Fachplaner / TGA (m/w/d) Heizungstechnik und Elektro KÜBLER GmbH
Ludwigshafen Zum Job 
Christian-Albrechts-Universität zu Kiel-Firmenlogo
Ingenieur*in der Fachrichtung Versorgungstechnik / Maschinenbau oder Elektrotechnik Christian-Albrechts-Universität zu Kiel
WPW JENA GmbH-Firmenlogo
Projektingenieur Elektroplanung (m/w/d) WPW JENA GmbH
Jena, hybrides Arbeiten Zum Job 
Bundesamt für Bauwesen und Raumordnung-Firmenlogo
Ingenieurin/Ingenieur (w/m/d) für die Koordination der Fachrichtung Elektrotechnik bzw. Nachrichtentechnik Bundesamt für Bauwesen und Raumordnung
Schleifring GmbH-Firmenlogo
Projektingenieur (m/w/d) Key Account in der Elektronikbranche Schleifring GmbH
Fürstenfeldbruck Zum Job 
Niedersächsische Landesbehörde für Straßenbau und Verkehr-Firmenlogo
Sachbearbeiter Datenkommunikationstechnik (w/m/d) Niedersächsische Landesbehörde für Straßenbau und Verkehr
Hannover Zum Job 
ENGIE Deutschland GmbH-Firmenlogo
Sales Manager (m/w/d) Energieeffizienzprojekte ENGIE Deutschland GmbH
Stuttgart, Köln, Frankfurt Zum Job 

Roboter profitieren von kombinierter KI-Strategie

Die Forschenden nennen ihren Ansatz „Policy Composition“ (PoCo). Er basiert auf den eingeführten Diffusionsmodellen. Jedes Diffusionsmodell wird mit einer anderen Datenart trainiert, zum Beispiel mit menschlichen Demovideos oder Daten aus der Teleoperation eines Roboterarms. Die erlernten Einzelstrategien werden gewichtet, kombiniert und iterativ verfeinert. So erfüllt die Gesamtstrategie auch die Ziele jeder Einzelstrategie.

„Einer der Vorteile dieses Ansatzes besteht darin, dass wir Strategien kombinieren können, um das Beste aus beiden Welten zu erhalten. So kann eine Strategie, die auf realen Daten basiert, die Geschicklichkeit verfeinern, während eine Strategie, die mittels Simulationsdaten trainiert wurde, mehr Generalisierung erreichen kann“, erklärt Wang.

KI-Modelle flexibel kombinierbar

Da die Strategien gesondert trainiert werden, können die Diffusionsmodelle flexibel kombiniert werden. Forschende können so ihre Trainingsergebnisse für bestimmte Aufgaben gezielt optimieren. Auch neue Daten sind einfach integrierbar, indem ein zusätzliches Modell damit trainiert wird. Der gesamte Lernprozess muss nicht jedes Mal aufs Neue von vorne beginnen. Die Forscherinnen und Forscher testeten PoCo in Simulationen und an echten Roboterarmen. Die künstliche Intelligenz steuerte die Roboter beim Ausführen verschiedener Werkzeugaufgaben, wie Nägel einschlagen oder Objekte mit einem Spachtel umdrehen. Dabei verbesserte PoCo die Leistung im Vergleich zu herkömmlichen Methoden um 20 Prozent.

Nach Aussage der Forschenden habe man nach Abschluss des kombinierten Trainings deutlich sehen können, dass die mehrfach trainierten Roboter ihre Werkzeuge effektiver einsetzen als die einfach trainierten Roboter. Die Wissenschaftlerinnen und Wissenschaftler wollen ihre Trainingstechnik künftig auf komplexere Aufgaben mit wechselnden Werkzeugen anwenden und noch größere Datensätze einbeziehen.

„Wir werden alle drei Arten von Daten benötigen, um in der Robotik erfolgreich zu sein: Internetdaten, Simulationsdaten und echte Roboterdaten. Die Millionen-Dollar-Frage wird sein, wie wir sie effektiv kombinieren können. PoCo ist hier ein wichtiger Schritt in die richtige Richtung“, kommentiert Jim Fan von NVIDIA, einem der führenden Anbieter von KI-Computing. NVIDIA war nicht an der Entwicklung der MIT-Technik beteiligt.

Ein Beitrag von:

  • Thomas Kresser

    Thomas Kresser macht Wissenschafts- und Medizinjournalismus für Publikumsmedien, Fachverlage, Forschungszentren, Universitäten und Kliniken. Er ist geschäftsführender Gesellschafter von ContentQualitäten und Geschäftsführer von DasKrebsportal.de. Seine Themen: Wissenschaft, Technik, Medizin/Medizintechnik und Gesundheit.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.