Quantenmaschinelle Lernverfahren, insbesondere das quantenbasierte bestärkende Lernen (QDRL, Quantum Deep Reinforcement Learning), haben in der Wissenschaft in den vergangenen Jahren enorm an Aufmerksamkeit gewonnen, da erfolgsversprechende Ergebnisse für einfache Aufgabenstellungen in simplen Simulationsumgebungen schnell gefunden wurden. Die bislang veröffentlichten Algorithmen haben den Vorteil, dass die Architektur der Quantenschaltung so gewählt ist, dass sie sich für kleine, aber relevante Beispiele auf aktuell verfügbarer Quantenhardware ausführen lässt. Aus der relativen Neuheit der Methoden des hybriden QDRL ergeben sich eine Reihe von offenen wissenschaftlichen Fragestellungen. Zum einen ist die Reproduzier- und Transferierbarkeit der publizierten Ansätze unklar. Darüber hinaus ist vor allem die Skalierbarkeit und damit die mögliche Anwendung in komplexeren Lernszenarien zu untersuchen.
Hierzu müssen allerdings insbesondere Möglichkeiten zur Kodierung hochdimensionaler Eingangsdaten in Quantenschaltkreise evaluiert werden. Außerdem ist zu klären, welche der zahlreichen aktuell erfolgreichen klassischen Algorithmen zum bestärkenden Lernen durch Komponenten des quantenmaschinellen Lernens sinnvoll erweitert werden können. Darüber hinaus sind die Untersuchung und Entwicklung neuer originärer hybrider QDRL-Algorithmen Felder mit signifikanten Potenzialen, da hier gezielt Verfahren entwickelt werden können, die in ihrer Struktur die Möglichkeiten von Quantenalgorithmen bereits vorsehen.
Das Vorhaben QuBER-KI wird einen signifikanten Beitrag zur Beantwortung dieser Fragestellungen leisten. Dafür sollen im Vorhaben strukturiert Antworten auf diese Fragen erarbeitet werden, indem zunächst der aktuelle Forschungsstand quantenerweiterter Algorithmen zum bestärkenden Lernen strukturiert, festgestellt und modularisiert wird. Darauf aufbauend wird zum einen die Komplexität der Umgebungen erhöht, um zu ermitteln, inwiefern die bestehenden Algorithmen auf weitere Umgebungen und Anwendungen übertragbar sind. Zum anderen werden die neuronalen Netze der aktuell in der Praxis erfolgreich eingesetzten klassischen Algorithmen für das bestärkende Lernen mit einer Quantenschaltung ersetzt. Dadurch wird ein Modul erstellt, in dem unterschiedliche Algorithmen mit Quantenschaltung in unterschiedlichen Umgebungen getestet werden können. So entsteht ein umfassendes Bild davon, welche Algorithmen bei welchen Lernproblemen die besten Ergebnisse erzielen.