Das Vorhaben hat zum Ziel, die Komplexität von Beispielen und Modellen für Roboterlernalgorithmen zu verringern. Dafür werden bekannte physikalische Gleichungen mit maschinellen Lernmodellen verbunden, um sich schneller an unbekannte Umgebungen anzupassen und um gleichzeitig die Modell-Unsicherheit zu quantifizieren. Auf dieses Weltmodell wird kausales Lernen angewandt, um Explorationsverhalten zu generieren und Prozesse des Verhaltenslernen zu beschleunigen. Sobald ein Weltmodell erlernt wurde, wird das Verhalten des Roboters durch Optimal Control oder Reinforcement Learning optimiert.