Sechs Full-Research-Papers und ein Industrial-Paper von DFKI-Forschenden zu Datenmanagement-Themen wurden auf der SIGMOD 2021 angenommen. "Die Annahme einer so hohen Anzahl von Papers aus einer deutschen Forschungsgruppe bei der SIGMOD ist außergewöhnlich. Ich bin sehr stolz auf diesen Erfolg und die internationale Anerkennung unserer Forschungsleistung", sagt Volker Markl.
Zwei der Publikationen sind das Ergebnis internationaler Forschungskooperationen. Eines dieser Papiere ist auf eine gemeinsame Arbeit mit Kolleg*innen der East China Normal University in Shanghai zurückzuführen. Die Autor*innen schlagen HyMAC vor, ein System, das es ermöglicht, iterative maschinelle Lernalgorithmen auf verteilten Datenflusssystemen effizienter auszuführen. Der Ansatz hat das Potenzial, den Prozess des maschinellen Lernens mit Daten aus Milliarden von Datenpunkten zu beschleunigen, indem er die Kommunikationskosten in Datenflusssystemen, wie z. B. Apache Flink, reduziert.
Die andere internationale Zusammenarbeit führte zu einer Veröffentlichung, die auf Arbeiten im Projekt ExDRa (Exploratory Data Science on Raw Data) basiert, das gemeinsam mit Forschenden des DFKI und der TU Berlin, der Siemens AG, der TU Graz und der Know-Center GmbH durchgeführt wurde. Dieses Paper wurde im SIGMOD Industrial Track angenommen. Das ExDRa-System wurde entwickelt, um den explorativen Data-Science-Prozess über heterogenen und verteilten Daten zu unterstützen. Typischerweise schlagen Datenwissenschaftler*innen in der Industrie Hypothesen vor und bewerten sie, integrieren die notwendigen Daten und führen Modelle aus, um interessante Muster zu identifizieren. Um diesen Prozess zu unterstützen, untersucht ExDRa, wie ein System entworfen und aufgebaut werden kann, das Unterstützung bietet und hilft, die Analyse von Problemen zu optimieren, die in verschiedenen Siemens-Anwendungsfällen (z.B. Chemie, Pharma, Wasser, Öl, Gas) auftreten. Dazu nutzt das Projekt das IoT-Datenmanagementsystem NebulaStream.