Ziel
Das Gesamtziel des Vorhabens BesMan ist die Entwicklung von Verfahren zur ein- und zweiarmigen Manipulation und zum Erlernen neuer, situationsspezifischer Verhaltensweisen mittels einer maschinellen Lernplattform. Obwohl viele Situationen mit reflexivem Verhalten gemeistert werden können, kann komplexes, zielgerichtetes Verhalten auf diesem Wege nicht automatisch erzeugt werden. Es ist daher sinnvoll, dass ein robotisches System eine Schnittstelle zu einem Operator besitzt, über die dieser dem Roboter durch die Demonstration von Verhalten Wege aus einer gefährlichen oder unvorhergesehenen Situation, die der Roboter aus eigener Kraft und mittels reflexiven Handlungen nicht meistern kann, zeigen kann.
Projektdetails
Zur Optimierung von komplexem, zielgerichtetem Verhalten durch Lernansätze ist zunächst die Entwicklung von Konzepten mittels Untersuchungen am Modell Mensch notwendig. Ansätze des Imitations- und Reinforcement-Lernens sollen verwendet werden, um gezeigtes Verhalten des Operators auf den Roboter zu übertragen.
Dabei soll insbesondere auch die Übertragung von Verhalten auf nicht-humanoide Roboter möglich werden. Hierfür muss ein schnelles, vollautomatisches Erlernen von Handlungen basierend auf beobachteten Handlungen des Operators unabhängig von den Abweichungen zwischen der Morphologie des Roboters und des Menschen realisiert werden. Die zu entwickelnde innovative Lernplattform soll hierbei möglichst generell sein, damit sie auf verschiedene Problemstellungen anwendbar ist und einen Transfer der Ansätze zwischen unterschiedlichen robotischen Systemen ermöglicht. Die erlernten Handlungen sollen sowohl ein- als auch zweiarmige Bewegungen umfassen.
Neben den hohen Anforderungen an die Flexibilität des Verhaltens robotischer Systeme in unvorhersehbaren Situationen steigen auch zusehends die Ansprüche an deren Interaktionsfähigkeit mit der Umgebung. Dies sind Probleme, die den Einsatz von zwei Manipulatoren mit vielen Freiheitsgraden und feinmotorischen Fähigkeiten erfordern.
Neben den erlernten Verhalten sollen Planungsalgorithmen zur autonomen Behandlung von Situationen, die nicht vorhergesehen wurden, aber ohne manuelle Intervention des Operators lösbar sind, sowie zur Koordination der Roboterarme eingesetzt werden. Reflexe sollen es ermöglichen, Probleme, die eine schnelle Reaktion erfordern, auf einer niedrigen Ebene zu behandeln, etwa um Kräfte, die durch die Endeffektoren an unterschiedlichen Stellen auf die manipulierten Objekte eingebracht werden, auszubalancieren. Für die Priorisierung unterschiedlicher Teilaufgaben und Fähigkeiten bzw. Verhalten, soll eine verhaltensbasierte Softwarearchitektur - entwickelt im Projekt SpaceClimber - eingesetzt werden, die die Bewältigung der Aufgabe steuert und auf dynamische Veränderungen und dadurch entstehende Randbedingungen reagiert sowie die Integration der zuvor genannten Lernansätze, Planungsverfahren und Reflexe erlaubt.
Die Ergebnisse dieses Projektes sollen generelle Lösungen aufzeigen und umsetzen, die unabhängig von der Morphologie und dem Einsatz des robotischen Systems zur Verwendung kommen können. Der Transfer der gefundenen Lösungen zwischen verschiedenen robotischen Systemen (z.B. humanoiden und nicht-humanoiden Systemen, oder Einarm- und Zweiarmsystemen) und zwischen Anwendungsgebieten (z.B. Raumfahrt und Logistik) soll beispielhaft anhand im Projekt zu definierender Aufgaben aufgezeigt werden.
Partner
Robotics Group, University of Bremen