Mit dieser Technik werden Roboter viel intelligenter
Forschende des MIT haben eine Technik entwickelt, die Robotikdaten aus unterschiedlichen Quellen mittels generativer KI sinnvoll kombiniert. Entsprechend trainierte Roboter setzten Werkzeuge wie Hammer, Schraubenzieher und Spachtel effektiver ein. Die Roboterleistung verbesserte sich um satte 20 Prozent – in Simulation und Praxis gleichermaßen.
Moderne Roboter sollen vielseitig sein und schnell neue Aufgaben lernen, damit sie zum Beispiel in der Lage sind, Reparaturen im Haus mit verschiedenen Werkzeugen durchzuführen. Dazu brauchen sie eine große Menge an Trainingsdaten, um den Werkzeuggebrauch zu lernen. Das Problem dabei: Vorhandene Datensätze sind je nach Anwendung und Umgebung sehr unterschiedlich: Farbbilder, taktile Parameter, Simulationen oder menschliche Demos – die Vielfalt der Daten erschwert das gezielte Training der Roboter.
Aus diesem Grund greifen viele Trainingsmethoden nur auf eine oder wenige Arten von Daten zurück. Der Nachteil: Die Roboter werden gut und spezifisch auf bestimmte Aufgaben trainiert, scheitern jedoch oft an neuen Aufgaben in unbekannten Umgebungen. Forschende des Massachusetts Institute of Technology (MIT) haben nun einen Weg gefunden, Daten aus vielen Quellen sinnvoll zu kombinieren. So können sie “einfache” Roboter zu Mehrzweck-Robotern ausbilden, die verschiedene Werkzeuge besser einsetzen können.
KI-Modelle lernen aus verschiedenen Datensätzen
Die Wissenschaftlerinnen und Wissenschaftler setzten in ihrem Ansatz auf sogenannte Diffusionsmodelle, eine bestimmte Form von generativer künstlicher Intelligenz (KI). Für jeden Datensatz trainierten sie ein separates Diffusionsmodell, das eine Strategie für eine bestimmte Aufgabe lernt. Anschließend kombinierten sie die erlernten Strategien zu einer allgemeinen Strategie. Durch dieses Vorgehen können Roboter verschiedene Aufgaben (besser) in unterschiedlichen Umgebungen ausführen.
„Der Umgang mit der Heterogenität von Roboterdatensätzen ist wie das bekannte Henne-Ei-Problem. Wenn wir viele Daten zum Trainieren allgemeiner Strategien verwenden wollen, brauchen wir zunächst einsatzfähige Roboter, um all diese Daten zu gewinnen. Ich denke, dass die Nutzung aller verfügbaren heterogenen Daten, ähnlich wie es die Forschenden mit ChatGPT getan haben, auch ein wichtiger Schritt für die Robotik ist“, sagt Lirui Wang, Hauptautorin des Artikels.
Roboter profitieren von kombinierter KI-Strategie
Die Forschenden nennen ihren Ansatz „Policy Composition“ (PoCo). Er basiert auf den eingeführten Diffusionsmodellen. Jedes Diffusionsmodell wird mit einer anderen Datenart trainiert, zum Beispiel mit menschlichen Demovideos oder Daten aus der Teleoperation eines Roboterarms. Die erlernten Einzelstrategien werden gewichtet, kombiniert und iterativ verfeinert. So erfüllt die Gesamtstrategie auch die Ziele jeder Einzelstrategie.
„Einer der Vorteile dieses Ansatzes besteht darin, dass wir Strategien kombinieren können, um das Beste aus beiden Welten zu erhalten. So kann eine Strategie, die auf realen Daten basiert, die Geschicklichkeit verfeinern, während eine Strategie, die mittels Simulationsdaten trainiert wurde, mehr Generalisierung erreichen kann“, erklärt Wang.
KI-Modelle flexibel kombinierbar
Da die Strategien gesondert trainiert werden, können die Diffusionsmodelle flexibel kombiniert werden. Forschende können so ihre Trainingsergebnisse für bestimmte Aufgaben gezielt optimieren. Auch neue Daten sind einfach integrierbar, indem ein zusätzliches Modell damit trainiert wird. Der gesamte Lernprozess muss nicht jedes Mal aufs Neue von vorne beginnen. Die Forscherinnen und Forscher testeten PoCo in Simulationen und an echten Roboterarmen. Die künstliche Intelligenz steuerte die Roboter beim Ausführen verschiedener Werkzeugaufgaben, wie Nägel einschlagen oder Objekte mit einem Spachtel umdrehen. Dabei verbesserte PoCo die Leistung im Vergleich zu herkömmlichen Methoden um 20 Prozent.
Nach Aussage der Forschenden habe man nach Abschluss des kombinierten Trainings deutlich sehen können, dass die mehrfach trainierten Roboter ihre Werkzeuge effektiver einsetzen als die einfach trainierten Roboter. Die Wissenschaftlerinnen und Wissenschaftler wollen ihre Trainingstechnik künftig auf komplexere Aufgaben mit wechselnden Werkzeugen anwenden und noch größere Datensätze einbeziehen.
„Wir werden alle drei Arten von Daten benötigen, um in der Robotik erfolgreich zu sein: Internetdaten, Simulationsdaten und echte Roboterdaten. Die Millionen-Dollar-Frage wird sein, wie wir sie effektiv kombinieren können. PoCo ist hier ein wichtiger Schritt in die richtige Richtung“, kommentiert Jim Fan von NVIDIA, einem der führenden Anbieter von KI-Computing. NVIDIA war nicht an der Entwicklung der MIT-Technik beteiligt.
Ein Beitrag von: