Machine Learning 09.03.2020, 07:00 Uhr

Roboter imitiert bei komplexen Aufgaben das menschliche Verhalten

Mehrdeutige Situationen wie das Decken eines Tisches stellen Roboter vor Herausforderungen. Ein Algorithmus hilft ihnen bei mehrdeutigen Aufgaben, berichten MIT-Forscher. Er orientiert sich an der Arbeitsweise von Menschen.

Durch die Beobachtung von Menschen lernen Roboter, komplexe Aufgaben wie das Decken eines Tisches auszuführen.
Foto: Christine Daniloff, MIT

Durch die Beobachtung von Menschen lernen Roboter, komplexe Aufgaben wie das Decken eines Tisches auszuführen.

Foto: Christine Daniloff, MIT

Bislang entwickeln Ingenieure nicht nur Roboter, sondern implementieren Bewegungsabläufe in deren Software. „Unsere Vision ist es, die Programmierung in die Hände von Fachgebietsexperten zu legen, die Roboter auf intuitive Weise programmieren können, anstatt einem Ingenieur Befehle zu beschreiben, die er ihrem Code hinzufügen soll“, sagt Ankit Shah vom Massachusetts Institute (MIT) in Cambridge. „Fabrikarbeiter können einem Roboter beibringen, komplexe Montageaufgaben auszuführen. Und Haushaltsroboter können von Menschen lernen, wie man Schränke stapelt, die Spülmaschine belädt oder den Tisch deckt.“  

Diesem Ziel sind MIT-Forscher jetzt ein Stück nähergekommen. Sie haben ein spezielles System entwickelt, „Planning with Uncertain Specifications“ (PUnS) genannt. Es soll Robotern die menschliche Fähigkeit näherbringen, viele, eventuell mehrdeutige Möglichkeiten der Planung abzuwägen, um ein Ziel zu erreichen. PUnS arbeitet mit Wahrscheinlichkeiten, um eine Aktion aus mehreren Optionen auszuwählen.

Für Roboter schwierig: den Tisch im Labor decken

Shahs Team entwickelte dafür eine besondere Aufgabe. Acht Objekte, nämlich ein Becher, ein Glas, ein Löffel, eine Gabel, ein Messer, ein Essteller, ein kleiner Teller und eine Schüssel, sollten auf verschiedene Art und Weise am Tisch drapiert werden.

Im ersten Schritt „beobachtete“ ein Roboter zufällig ausgewählte menschliche Handlungen beim Decken des Tischs. Dann beauftragten Forscher ihre Maschine damit, den Tisch automatisch in einer bestimmten Konfiguration zu decken, und zwar in realen Experimenten und in der Simulation.

Stellenangebote im Bereich Automatisierungstechnik

Automatisierungstechnik Jobs
ATLAS TITAN Mitte GmbH-Firmenlogo
Ingenieur Elektrotechnik (m/w/d) Schwerpunkt Automatisierungstechnik ATLAS TITAN Mitte GmbH
Braunschweig Zum Job 
ATLAS TITAN Mitte GmbH-Firmenlogo
Projektleiter Leitungsbau Schutztechnik (m/w/d) ATLAS TITAN Mitte GmbH
Stadtwerke Schneverdingen-Neuenkirchen GmbH-Firmenlogo
Leitender Ingenieur (m/w/d) Netzbau und -betrieb Strom und Breitband Stadtwerke Schneverdingen-Neuenkirchen GmbH
Schneverdingen Zum Job 
SPITZKE SE GVZ Berlin Süd-Firmenlogo
Bauleiter Elektrotechnik (m/w/d) SPITZKE SE GVZ Berlin Süd
Großbeeren Zum Job 
WIRTGEN GmbH-Firmenlogo
System- und Softwarearchitekt (m/w/d) - mobile Arbeitsmaschinen WIRTGEN GmbH
Windhagen (Raum Köln/Bonn) Zum Job 
WIRTGEN GmbH-Firmenlogo
Embedded Anwendungs-Softwareentwickler (m/w/d) - mobile Arbeitsmaschinen WIRTGEN GmbH
Windhagen (Raum Köln/Bonn) Zum Job 
Albtal-Verkehrs-Gesellschaft mbH-Firmenlogo
Projektleiter*in Elektrotechnik, Elektroingenieur*in oder Techniker*in (m/w/d) Albtal-Verkehrs-Gesellschaft mbH
Karlsruhe Zum Job 
WBS Training AG-Firmenlogo
Technische Trainer:in Automatisierungstechnik - CAD/CAM-Programmierung (m/w/d) WBS Training AG
remote (deutschlandweit) Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Projektleiter (m/w/i) für Röntgen-, Isotopen- und optische Messsysteme IMS Messsysteme GmbH
Heiligenhaus Zum Job 
über Martin & Partner Societät für Unternehmensberatung-Firmenlogo
Leiter Entwicklung & Konstruktion (m/w/d) über Martin & Partner Societät für Unternehmensberatung
Südlich von Stuttgart Zum Job 
ILF Beratende Ingenieure GmbH-Firmenlogo
Senior Ingenieur Mess-, Steuerungs- und Regelungstechnik (m/w/d) ILF Beratende Ingenieure GmbH
Bremen, Berlin, Hamburg, München, Essen Zum Job 
ILF Beratende Ingenieure GmbH-Firmenlogo
Junior Ingenieur Mess-, Steuerungs- und Regelungstechnik (m/w/d) ILF Beratende Ingenieure GmbH
München Zum Job 
IPH Institut "Prüffeld für elektrische Hochleistungstechnik" GmbH-Firmenlogo
Ingenieur Elektrotechnik (m/w/d) für Transformatoren IPH Institut "Prüffeld für elektrische Hochleistungstechnik" GmbH
ME MOBIL ELEKTRONIK GMBH-Firmenlogo
Support- und Applikationsingenieur (m/w/d) ME MOBIL ELEKTRONIK GMBH
Langenbrettach Zum Job 
FERCHAU GmbH-Firmenlogo
Konstruktiver Elektroingenieur (m/w/d) FERCHAU GmbH
FERCHAU GmbH-Firmenlogo
Konstrukteur (m/w/d) FERCHAU GmbH
PFISTERER Kontaktsysteme GmbH-Firmenlogo
Technical Support High Voltage Accessories (m/w/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
B. Braun Melsungen AG-Firmenlogo
Global Lead (w/m/d) Operational Technology (OT) B. Braun Melsungen AG
Melsungen Zum Job 
WIRTGEN GmbH-Firmenlogo
Duales Studium Software Engineering - Bachelor of Engineering (m/w/d) WIRTGEN GmbH
Windhagen, Remagen Zum Job 
Infraserv GmbH & Co. Höchst KG-Firmenlogo
Ingenieur (w/m/d) Anlagen- & Prozesssicherheit Infraserv GmbH & Co. Höchst KG
Frankfurt am Main Zum Job 

Um erfolgreich zu sein, musste der Roboter viele mögliche Abfolgen der Handlungen berücksichtigen. Das gelang, selbst wenn die Gegenstände absichtlich entfernt, gestapelt oder versteckt worden waren. Wie Shah berichtet, sei dies bei klassischer Programmierung kaum möglich; es komme zu hohen Fehlerraten.

Mit linearer temporaler Logik Handlungen planen

Zum Hintergrund: Bei Entscheidungsaufgaben sind Ansätze des Reinforcement Learning (des bestärkenden Lernens) bekannt. Darunter versteht man Methoden des maschinellen Lernens, bei denen ein Roboter selbstständig eine Strategie erlernt, um „Belohnungen“ zu maximieren. Er bekommt zu bestimmten Zeitpunkten Rückmeldung in Form von „Strafen“ oder „Belohnungen“. Das ist aber nur möglich, falls man klare Kriterien für den Erfolg oder den Misserfolg definieren kann – also nicht generell bei Aufgaben im Haushalt. Schließlich kann man den Tisch – bei gleicher Anordnung der Gegenstände – mit unterschiedlichen Handlungen decken.

Deshalb arbeiten die Forscher mit PUnS („Planning with Uncertain Specifications“). Es basiert auf der linearen temporalen Logik (LTL, Linear Temporal Logic). In LTL können Formeln über die Zukunft von Ereignispfaden aufgestellt werden. Ein Kriterium könnte sein, dass eine Bedingung irgendwann wahr wird oder eine Bedingung wahr bleibt, bis eine andere Bedingung erfüllt wird („der Tisch wurde gedeckt, wenn acht Gegenstände nach einem Muster darauf liegen“).

Die Beobachtungen des Roboters bei 30 menschlichen Demonstrationen mit Geschirr und Besteck ergaben 25 verschiedene LTL-Formeln. Jede Formel kodierte eine etwas andere Präferenz – oder Spezifikation – für die Aufgabe. Unterschiede gibt es im Kompromiss zwischen Flexibilität und Risiko. Darüber sollen später dann die Anwender selbst entscheiden.

Geringe Fehlerrate bei Tests im Labor  

Schließlich führten die Forscher 2.000 Simulationen und Experimente durch. Dabei machte ein Roboter, er sollte den Tisch in verschiedenen Varianten oder Abfolgen decken, nur sechs Fehler. Er zeigte ein ähnliches Verhalten wie Menschen bei dieser Aufgabe. Wenn beispielsweise ein Gegenstand anfangs nicht sichtbar war, beendete der Roboter das Decken an der Stelle, um andere Gegenstände zu greifen. Sobald er auf die Gabel stieß, sie war beispielsweise unter einem Teller, arbeitete er mit diesem Besteckteil weiter.

„Unser System zeigt eine hohe Flexibilität“, kommentiert Shah. „Sonst würde der Roboter stoppen, weil er ‚erwartet‘, ohne die Gabel den restlichen Tisch nicht eindecken zu können.“

Im nächsten Schritt wollen die Forscher ihr System so modifizieren, dass es Robotern hilft, unterschiedliche Signale zu verarbeiten. „Angenommen, eine Person führt einem Roboter vor, wie man einen Tisch an nur einer Stelle aufstellen kann. Die Person kann sagen, ‚mach das Gleiche für alle anderen Stellen‘ oder ‚leg das Messer hier stattdessen vor die Gabel’“, erklärt Shah. „Wir wollen Methoden entwickeln, mit denen sich das System auf natürliche Weise an diese verbalen Befehle anpassen kann, ohne dass zusätzliche Demonstrationen erforderlich sind.“

Lesen Sie auch:

Mehr zum Thema Robotik

Ein Beitrag von:

  • Michael van den Heuvel

    Michael van den Heuvel hat Chemie studiert. Unter anderem arbeitet er für Medscape, DocCheck, für die Universität München und für pharmazeutische Fachmagazine. Seit 2017 ist er selbstständiger Journalist und Gesellschafter von Content Qualitäten. Seine Themen: Chemie/physikalische Chemie, Energie, Umwelt, KI, Medizin/Medizintechnik.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.