KI und Robotik 05.06.2024, 07:00 Uhr

Mit dieser Technik werden Roboter viel intelligenter

Forschende des MIT haben eine Technik entwickelt, die Robotikdaten aus unterschiedlichen Quellen mittels generativer KI sinnvoll kombiniert. Entsprechend trainierte Roboter setzten Werkzeuge wie Hammer, Schraubenzieher und Spachtel effektiver ein. Die Roboterleistung verbesserte sich um satte 20 Prozent – in Simulation und Praxis gleichermaßen.

Schraubender Roboter Schraube in Oberfläche

Eine spezielle KI macht Roboter intelligenter.

Moderne Roboter sollen vielseitig sein und schnell neue Aufgaben lernen, damit sie zum Beispiel in der Lage sind, Reparaturen im Haus mit verschiedenen Werkzeugen durchzuführen. Dazu brauchen sie eine große Menge an Trainingsdaten, um den Werkzeuggebrauch zu lernen. Das Problem dabei: Vorhandene Datensätze sind je nach Anwendung und Umgebung sehr unterschiedlich: Farbbilder, taktile Parameter, Simulationen oder menschliche Demos – die Vielfalt der Daten erschwert das gezielte Training der Roboter.

Aus diesem Grund greifen viele Trainingsmethoden nur auf eine oder wenige Arten von Daten zurück. Der Nachteil: Die Roboter werden gut und spezifisch auf bestimmte Aufgaben trainiert, scheitern jedoch oft an neuen Aufgaben in unbekannten Umgebungen. Forschende des Massachusetts Institute of Technology (MIT) haben nun einen Weg gefunden, Daten aus vielen Quellen sinnvoll zu kombinieren. So können sie “einfache” Roboter zu Mehrzweck-Robotern ausbilden, die verschiedene Werkzeuge besser einsetzen können.

KI-Modelle lernen aus verschiedenen Datensätzen

Die Wissenschaftlerinnen und Wissenschaftler setzten in ihrem Ansatz auf sogenannte Diffusionsmodelle, eine bestimmte Form von generativer künstlicher Intelligenz (KI). Für jeden Datensatz trainierten sie ein separates Diffusionsmodell, das eine Strategie für eine bestimmte Aufgabe lernt. Anschließend kombinierten sie die erlernten Strategien zu einer allgemeinen Strategie. Durch dieses Vorgehen können Roboter verschiedene Aufgaben (besser) in unterschiedlichen Umgebungen ausführen.

„Der Umgang mit der Heterogenität von Roboterdatensätzen ist wie das bekannte Henne-Ei-Problem. Wenn wir viele Daten zum Trainieren allgemeiner Strategien verwenden wollen, brauchen wir zunächst einsatzfähige Roboter, um all diese Daten zu gewinnen. Ich denke, dass die Nutzung aller verfügbaren heterogenen Daten, ähnlich wie es die Forschenden mit ChatGPT getan haben, auch ein wichtiger Schritt für die Robotik ist“, sagt Lirui Wang, Hauptautorin des Artikels.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Hochschule Esslingen - University of Applied Sciences-Firmenlogo
Professur (W2) für das Lehr- und Forschungsgebiet "Automatisierungstechnik mit Schwerpunkt Antriebstechnik" Hochschule Esslingen - University of Applied Sciences
Esslingen am Neckar Zum Job 
Iqony Solutions GmbH-Firmenlogo
Projektleiter:in Energietechnik (m/w/d) - FTE 1 Iqony Solutions GmbH
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur / Techniker als Teamleitung Planung / Bau / Betrieb (w/m/d) Die Autobahn GmbH des Bundes
Narda Safety Test Solutions GmbH-Firmenlogo
Entwicklungsingenieur für Antennen- und HF-Design (m/w/d) Narda Safety Test Solutions GmbH
Pfullingen Zum Job 
BRUNATA-METRONA GmbH & Co. KG-Firmenlogo
Referent (m/w/d) Technische Gremien BRUNATA-METRONA GmbH & Co. KG
Köln, Hamburg, München Zum Job 
ZVEI e.V.-Firmenlogo
Fachverbandsgeschäftsführung Elektroinstallationssysteme (w/m/d) ZVEI e.V.
Berlin, Frankfurt am Main Zum Job 
ILF CONSULTING ENGINEERS GERMANY GMBH-Firmenlogo
Lead Ingenieur für Thermische Systeme (m/w/d) ILF CONSULTING ENGINEERS GERMANY GMBH
München Zum Job 
POLYVANTIS GmbH-Firmenlogo
Ingenieur (m/w/d) Elektrotechnik / Maschinenbau / Verfahrenstechnik als Projektmanager POLYVANTIS GmbH
Weiterstadt Zum Job 
POLYVANTIS GmbH-Firmenlogo
Ingenieur / Techniker Elektrotechnik / Automatisierungstechnik (m/w/d) POLYVANTIS GmbH
Weiterstadt Zum Job 
Leuze electronic GmbH + Co. KG-Firmenlogo
Experienced Mechanical Engineer (m/f/x) Leuze electronic GmbH + Co. KG
Owen bei Kirchheim / Teck Zum Job 
Haus der Technik e.V.-Firmenlogo
Fachdozent/in und Berater/in (m/w/d) für Krane und Hebezeuge in der Weiterbildung Haus der Technik e.V.
über ifp | Executive Search. Management Diagnostik.-Firmenlogo
Teamleiter:in Mechanical & Electrical Engineering über ifp | Executive Search. Management Diagnostik.
Emlichheim Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Systemingenieur (m/w/i) für Oberflächeninspektion IMS Messsysteme GmbH
Heiligenhaus Zum Job 
ZVEI e.V.-Firmenlogo
Manager/in Automation (w/m/d) ZVEI e.V.
Frankfurt am Main Zum Job 
Stuttgart Netze GmbH-Firmenlogo
Ingenieur Stationsplanung (w/m/d) Stuttgart Netze GmbH
Stuttgart Zum Job 
Narda Safety Test Solutions GmbH'-Firmenlogo
Entwicklungsingenieur Hardware (m/w/d) Narda Safety Test Solutions GmbH'
Pfullingen Zum Job 
TenneT TSO GmbH-Firmenlogo
Ingenieur als Projektleiter Leitungsbau (m/w/d) TenneT TSO GmbH
Tebis ProLeiS GmbH-Firmenlogo
MES Consultant (m/w/d) Tebis ProLeiS GmbH
Martinsried/Planegg, Erndtebrück, Aachen, Home-Office Zum Job 
Heraeus Electronics GmbH & Co. KG-Firmenlogo
Head (m/f/d) of Global Quality Heraeus Electronics GmbH & Co. KG
BEC Robotics-Firmenlogo
Application Engineer (m/w/d) BEC Robotics
Pfullingen Zum Job 
Hochschule Esslingen - University of Applied Sciences-Firmenlogo
Professur (W2) für das Lehr- und Forschungsgebiet "Automatisierungstechnik mit Schwerpunkt Antriebstechnik" Hochschule Esslingen - University of Applied Sciences
Esslingen am Neckar Zum Job 
Iqony Solutions GmbH-Firmenlogo
Projektleiter:in Energietechnik (m/w/d) - FTE 1 Iqony Solutions GmbH
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur / Techniker als Teamleitung Planung / Bau / Betrieb (w/m/d) Die Autobahn GmbH des Bundes
Narda Safety Test Solutions GmbH-Firmenlogo
Entwicklungsingenieur für Antennen- und HF-Design (m/w/d) Narda Safety Test Solutions GmbH
Pfullingen Zum Job 

Roboter profitieren von kombinierter KI-Strategie

Die Forschenden nennen ihren Ansatz „Policy Composition“ (PoCo). Er basiert auf den eingeführten Diffusionsmodellen. Jedes Diffusionsmodell wird mit einer anderen Datenart trainiert, zum Beispiel mit menschlichen Demovideos oder Daten aus der Teleoperation eines Roboterarms. Die erlernten Einzelstrategien werden gewichtet, kombiniert und iterativ verfeinert. So erfüllt die Gesamtstrategie auch die Ziele jeder Einzelstrategie.

„Einer der Vorteile dieses Ansatzes besteht darin, dass wir Strategien kombinieren können, um das Beste aus beiden Welten zu erhalten. So kann eine Strategie, die auf realen Daten basiert, die Geschicklichkeit verfeinern, während eine Strategie, die mittels Simulationsdaten trainiert wurde, mehr Generalisierung erreichen kann“, erklärt Wang.

KI-Modelle flexibel kombinierbar

Da die Strategien gesondert trainiert werden, können die Diffusionsmodelle flexibel kombiniert werden. Forschende können so ihre Trainingsergebnisse für bestimmte Aufgaben gezielt optimieren. Auch neue Daten sind einfach integrierbar, indem ein zusätzliches Modell damit trainiert wird. Der gesamte Lernprozess muss nicht jedes Mal aufs Neue von vorne beginnen. Die Forscherinnen und Forscher testeten PoCo in Simulationen und an echten Roboterarmen. Die künstliche Intelligenz steuerte die Roboter beim Ausführen verschiedener Werkzeugaufgaben, wie Nägel einschlagen oder Objekte mit einem Spachtel umdrehen. Dabei verbesserte PoCo die Leistung im Vergleich zu herkömmlichen Methoden um 20 Prozent.

Nach Aussage der Forschenden habe man nach Abschluss des kombinierten Trainings deutlich sehen können, dass die mehrfach trainierten Roboter ihre Werkzeuge effektiver einsetzen als die einfach trainierten Roboter. Die Wissenschaftlerinnen und Wissenschaftler wollen ihre Trainingstechnik künftig auf komplexere Aufgaben mit wechselnden Werkzeugen anwenden und noch größere Datensätze einbeziehen.

„Wir werden alle drei Arten von Daten benötigen, um in der Robotik erfolgreich zu sein: Internetdaten, Simulationsdaten und echte Roboterdaten. Die Millionen-Dollar-Frage wird sein, wie wir sie effektiv kombinieren können. PoCo ist hier ein wichtiger Schritt in die richtige Richtung“, kommentiert Jim Fan von NVIDIA, einem der führenden Anbieter von KI-Computing. NVIDIA war nicht an der Entwicklung der MIT-Technik beteiligt.

Ein Beitrag von:

  • Thomas Kresser

    Thomas Kresser macht Wissenschafts- und Medizinjournalismus für Publikumsmedien, Fachverlage, Forschungszentren, Universitäten und Kliniken. Er ist geschäftsführender Gesellschafter von ContentQualitäten und Geschäftsführer von DasKrebsportal.de. Seine Themen: Wissenschaft, Technik, Medizin/Medizintechnik und Gesundheit.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.