Konzept der Verallgemeinerung 26.04.2022, 07:00 Uhr

Roboter lernen schneller: Mit 3D-Geometrie in 10 Minuten zum Erfolg

Roboter sind heute schon in der Lage, dem Menschen viele Tätigkeiten abzunehmen. Bislang waren dafür umfangreiche Lernschritte nötig. Forschende vom MIT haben nun eine Variante entwickelt, mit der ein Roboter in 10 bis 15 Minuten in der Lage ist, eine neue Aufgabe zu erledigen.

Roboterarm greift Karton

Ein besonderes neuronales Netzwerkmodell sorgt dafür, dass Roboter schneller lernen können.

Foto: panthermedia.net/vinkfan (YAYMicro)

Roboter gehören zu unserer Lebens- und Arbeitswelt inzwischen ganz selbstverständlich dazu. Beispiel Lagerarbeit: Hier sind hauptsächlich Roboter zwischen den einzelnen Regalen am Werk. Sie nehmen Produkte heraus und legen sie in Kartons. Das funktioniert reibungslos, solange der Roboter sich auf ein Produkt konzentrieren kann. Sobald ein anderes hinzukommt – und dabei reicht es schon aus, dass dieses Produkt eine leicht andere Form aufweist – wird es komplizierter. Denn dann muss der Roboter neu lernen, wie er zu greifen hat, um adäquat damit umgehen zu können. Und genau dabei spielt der Faktor Zeit bisher eine große Rolle. Denn das Anlernen ist in der Regel sehr zeitintensiv. Forschenden des Massachusetts Institute of Technology (MIT) ist es nun gelungen, einen Roboter innerhalb von 10 bis 15 Minuten für eine neue Aufgabe zu trainieren. Ihre Technik: ein neuronales Netzwerk.

Dieser Roboter backt Pizza!

Das neuronale Netzwerk, dass die MIT-Forschenden einsetzen, wurde speziell für diese Aufgabe entwickelt. Das Besondere: Es kann Formen von 3D-Objekten rekonstruieren. Einer der Forschenden beschreibt es so: „Unser Hauptbeitrag ist die allgemeine Fähigkeit, Robotern, die in unstrukturierten Umgebungen mit viel Schwankungen arbeiten müssen, viel effizienter neue Fähigkeiten zu vermitteln. Das Konzept der Verallgemeinerung durch Konstruktion ist eine faszinierende Fähigkeit, weil dieses Problem normalerweise so viel schwieriger ist“, sagt Anthony Simeonov.

Roboter lernen schneller und können nach zehn Demonstrationen Gegenstände erkennen

Getestet haben die Forschenden ihr neues System in Simulationen und mit einem echten Roboterarm. Die Ergebnisse: Der Arm griff Becher, Schalen und Flaschen, die er nie zuvor gesehen hatte. Sie waren zudem noch zufällig sortiert und wurden zwischendurch sogar umgestellt. Für dieses Ergebnis waren nur zehn Demonstrationen notwendig, damit der Roboter entsprechend trainiert war. Das ist ein Durchbruch für die Forschung, denn bislang konnte ein Roboter angelernt werden, einen Gegenstand aufzuheben. Sobald dieser aber plötzlich anders lag, deutete der Roboter dies als neues Szenario und konnte damit nicht umgehen, ohne nochmals auf diese neue Situation trainiert zu werden. Es war bislang für maschinelle Lernsysteme schwierig, neue Objektorientierungen zu verallgemeinern.

Stellenangebote im Bereich Automatisierungstechnik

Automatisierungstechnik Jobs
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur/in (m/w/d) für Tunnelsicherheit Die Autobahn GmbH des Bundes
Stuttgart Zum Job 
SE Tylose GmbH & Co. KG-Firmenlogo
Ingenieur der Mess- und Regeltechnik (m/w/d) für Investitionsprojekte SE Tylose GmbH & Co. KG
Wiesbaden Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
GEBHARDT Fördertechnik GmbH-Firmenlogo
Senior Layout Designer (m/w/d) GEBHARDT Fördertechnik GmbH
Sinsheim Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur Immissionsschutz (m/w/d) Die Autobahn GmbH des Bundes
Hohen Neuendorf Zum Job 
HENN GmbH-Firmenlogo
Ingenieur*in | Technische Ausrüstung Elektrotechnik / HLSK HENN GmbH
München Zum Job 
TÜV Hessen-Firmenlogo
Sachverständiger Elektrotechnik (m/w/d) TÜV Hessen
Frankfurt am Main Zum Job 
Bundesamt für Strahlenschutz-Firmenlogo
Ingenieur*in (FH/Bachelor) (m/w/d) Elektrotechnik, Physik, Medizintechnik, Informationstechnik im "Kompetenzzentrum Elektromagnetische Felder" der Abteilung "Wirkungen und Risiken ionisierender und nichtionisierender Strahlung" Bundesamt für Strahlenschutz
Oberschleißheim (bei München) Zum Job 
Stadt Köln-Firmenlogo
Fachkraft für Arbeitssicherheit (m/w/d) beim Betrieblichen Gesundheitsmanagement Stadt Köln
Stuttgart Netze GmbH-Firmenlogo
(Junior) Ingenieur Elektrotechnik Projektierung (w/m/d) Stuttgart Netze GmbH
Stuttgart Zum Job 
Synthos Schkopau GmbH-Firmenlogo
Improvement Engineer - Rubber Process Technology (m/w/d) Synthos Schkopau GmbH
Schkopau Zum Job 
Max-Planck-Institut für Astronomie-Firmenlogo
Astronom*in / Physiker*in / Ingenieur*in (m/w/d) für Adaptive Optik Max-Planck-Institut für Astronomie
Heidelberg Zum Job 
ONTRAS Gastransport GmbH-Firmenlogo
Ingenieur Maschinen- und Anlagentechnik (m/w/d) ONTRAS Gastransport GmbH
Leipzig Zum Job 
Karlsruher Institut für Technologie-Firmenlogo
Ingenieurin / Ingenieur (w/m/d) im Bereich mechanische Entwicklung und Projektleitung Karlsruher Institut für Technologie
Eggenstein-Leopoldshafen Zum Job 
Neenah Gessner GmbH-Firmenlogo
Techniker Maschinenbau (m/w/d) Neenah Gessner GmbH
Bruckmühl Zum Job 
VIVAVIS AG-Firmenlogo
Sales Manager Bahn (m/w/d) VIVAVIS AG
Berlin, Home-Office Zum Job 
Alhäuser + König Ingenieurbüro GmbH-Firmenlogo
Ingenieur:in für Elektrotechnik / Master / Bachelor /Diplom (m/w/d) Alhäuser + König Ingenieurbüro GmbH
Bonn, Hachenburg Zum Job 
Stadtwerke Rüsselsheim GmbH-Firmenlogo
Messtechniker als Spezialist Gerätemanagement Strom (m/w/d Stadtwerke Rüsselsheim GmbH
Rüsselsheim Zum Job 
Agile Robots SE-Firmenlogo
Senior Projektingenieur - Industrial Automation (m/w/d) Agile Robots SE
München Zum Job 
Schleifring GmbH-Firmenlogo
Director Service (m/w/d) Schleifring GmbH
Fürstenfeldbruck Zum Job 

Genau dieser Herausforderung stellten sich die Forschenden und entwickelten als Lösung eine neue Art des neuronalen Netzwerkmodells, ein sogenanntes Neural Descriptor Field (NDF). Es sollte in der Lage sein, die 3D-Geometrie einer Klasse von Gegenständen zu erlernen. Dafür berechne das Modell die geometrische Darstellung mithilfe einer 3D-Punktwolke.  Es handelt sich dabei um einen Satz von Datenpunkten oder Koordinaten in drei Dimensionen. Eine spezielle Tiefenkamera könne die Datenpunkte festhalten und so die Informationen über die Entfernung hin zur Verfügung stellen. Zuvor habe man das Netzwerk in einer Simulation umfassend und aufwendig zu synthetischen 3D-Formen trainiert. Das reiche aus, damit es nun bei Objekten in der realen Welt funktioniere.

Roboter lernen schneller dank der Methode der Äquivarianz

Basis des NFD ist die Methode der Äquivarianz. Das bedeutet: Wenn dem Modell ein Bild eines Bechers gezeigt wird, der aufrecht steht, und danach eines vom selben Becher, der auf der Seite liegt, könne das System daraus schlussfolgern, dass es sich bei dem zweiten Becher um dasselbe Objekt handle, sich nur eben in einer anderen Perspektive darstelle. „Diese Äquivarianz ermöglicht es uns, Fälle effektiver zu handhaben, in denen das beobachtete Objekt eine willkürliche Ausrichtung hat“, erklärt Simeonov.

Dahinter steckt die Idee, dass das NDF lernt, Formen ähnlicher Objekte zu rekonstruieren und dabei zugleich auch verwandte Teile dieser Objekte zu assoziieren. Bleiben wir bei dem Beispiel des Bechers: Es gibt flache Becher, hohe, welche mit kleinem oder mit größerem Henkel. All das kann das System erkennen und weiß dabei immer, dass es sich grundsätzlich um ein Objekt handelt. Würde man eine andere Methode wählen, müsste man die verschiedenen Becher beschriften und die Unterschiede herausstellen. So kann man dagegen auf die Formenrekonstruktion zurückgreifen.

Roboter lernen schneller und sollen ihr „Wissen“ künftig übertragen können

Für ihre Studie verwendeten die Forschenden nur wenige physische Beispiele, um den Roboter anzulernen. Dafür bewegten sie die Hand des Roboters auf den Teil des Objekts, das er greifen soll, zum Beispiel den Griff des Bechers. Zeitgleich zeichneten sie dabei die Positionen der Fingerspitzen auf. Das NDF kann durch diese Form des Trainings die Struktur einer neuen Form ableiten und damit die Demonstrationen auf neue Objekte übertragen.

Für die Zukunft wollen die Forschenden die Kategorien erweitern oder es eventuell sogar erreichen, die Kategorie gänzlich aufzuheben. Denn dann könne der Roboter möglicherweise sein erlerntes „Wissen“ über Becher auch auf andere Objekte, wie Kisten oder Kopfhörer, übertragen.

Mehr zum Thema Roboter:

Ein Beitrag von:

  • Nina Draese

    Nina Draese hat unter anderem für die dpa gearbeitet, die Presseabteilung von BMW, für die Autozeitung und den MAV-Verlag. Sie ist selbstständige Journalistin und gehört zum Team von Content Qualitäten. Ihre Themen: Automobil, Energie, Klima, KI, Technik, Umwelt.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.