Mit den Fortschritten auf dem Gebiet der subsymbolischen KI, wie dem Deep Learning, werden auch die Grenzen datenbasierter Verfahren in Bezug auf Sicherheit und Zuverlässigkeit immer deutlicher. Denn Entscheidungen, die durch maschinelles Lernen getroffen werden, basieren weder auf symbolischen Berechnungen noch sind sie durch logische Regeln erklärbar und damit mathematisch nicht beweisbar. Gerade in sicherheitskritischen Bereichen wie der humanoiden Robotik ist die Verifizierbarkeit jedoch entscheidend, um das Risiko von Fehlfunktionen zu minimieren und eine sichere Umgebung zu gewährleisten.
Dank hybrider KI: komplexes Roboterverhalten lernen und verifizieren
Im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts „VeryHuman“ haben DFKI-Wissenschaftlerinnen und -Wissenschaftler daher einen innovativen Ansatz entwickelt, der subsymbolische und symbolische KI-Methoden kombiniert. Konkret nutzten sie symbolische Spezifikationen im Reinforcement Learning, bei dem ein System für mathematisch überprüfbare Ergebnisse belohnt wird. Dafür bündelten die zwei Bremer Forschungsbereiche Robotics Innovation Center, geleitet von Prof. Dr. Frank Kirchner, und Cyber-Physical Systems, geleitet von Prof. Dr. Rolf Drechsler, ihre Kompetenzen. Ziel war es, ein KI-basiertes Steuerungssystem für humanoide Roboter zu entwickeln, mit dem menschenähnliche Fähigkeiten wie sicheres und stabiles Laufen oder andere komplexe Bewegungen erreicht werden können.
Ableitung von Belohnungsfunktionen aus symbolischen Beschreibungen
Durch die Verwendung symbolischer Spezifikationen, wie einer einfachen Sprache zur Beschreibung des Roboterverhaltens, ist es dem Projektteam gelungen, abstrakte kinematische Modelle zu erstellen, die mathematisch überprüft werden können. Diese Abstraktionen definieren Belohnungsfunktionen für das Reinforcement Learning und ermöglichen es dem Roboter, seine Entscheidungen anhand der Modelle zu verifizieren. Dadurch wird die Zuverlässigkeit der Entscheidungen erhöht, was stabile und vorhersehbare Roboterbewegungen gewährleistet und das Risiko von Fehlverhalten oder unerwarteten Aktionen minimiert.
Zusätzlich wurde das gewünschte Roboterverhalten als hybrider Automat modelliert, ein mathematisches Modell, das sowohl kontinuierliches als auch diskretes Verhalten beschreibt. Dies reduziert den Zustandsraum des Systems und ermöglicht so ein effizienteres Lernen.
Schnelles dynamisches Laufen mit dem humanoiden Roboter RH5
Darüber hinaus ist es den Forschenden im Rahmen des Projekts gelungen, dynamisches Laufen mit dem humanoiden Roboter „RH5“ des DFKI zu realisieren. Dazu kombinierten sie die Methode des Nullmomentpunktes (der Punkt auf der Standfläche eines Roboters, an dem die resultierende Bodenkraft kein Kippmoment erzeugt) mit dem Ansatz der Ganzkörperregelung. Diese Kombination ermöglicht die Maximierung der Stabilität und Leistungsfähigkeit von lagegeregelten Robotern. So konnte robustes dynamisches Laufen bei unterschiedlichen Geschwindigkeiten und Schrittlängen unter effektiver Ausnutzung der Systemgrenzen sowohl hinsichtlich der Geschwindigkeit als auch des Bewegungsumfangs erreicht werden.
Nach Kenntnis der Forschenden ist dies das erste Mal, dass ein humanoider Roboter dynamisch mit bis zu 0,43 m/s gelaufen ist. Sieht man von Systemen mit aktiven Zehengelenken ab, gehört RH5 damit zu den schnellsten Humanoiden ähnlicher Größe und Antriebsmodalitäten. Um das Verhalten von RH5 weiter zu verbessern, setzte das Team zusätzlich Algorithmen zur Simulation und optimalen Steuerung ein, die auf dem symbolischen Modell des Systems basieren.
Mehr Effizienz und Sicherheit für KI-Anwendungen in Hochrisikobereichen
Da die präzise Modellierung und Optimierung von Bewegungsabläufen sowohl die Sicherheit als auch die Effizienz von Robotern erhöht, kann der im Projekt entwickelte hybride KI-Ansatz als Blaupause für die Generierung von Belohnungsfunktionen aus symbolischer, logikbasierter KI dienen. Dies ist insbesondere für Anwendungen relevant, bei denen die Systeme oder deren Fehlverhalten eine potenzielle Gefahr für den Menschen darstellen.
VeryHuman wurde vom Bundesministerium für Bildung und Forschung (BMBF) von Juni 2020 bis Mai 2024 unter dem Förderkennzeichen 01IW20004 gefördert.