Sieben Datenmanagement-Papers auf der ACM SIGMOD 2021 präsentiert

Die ACM International Conference on the Management of Data (SIGMOD) 2021 - eine hochrangige internationale Konferenz für Datenbanksysteme und Informationsmanagement - hat sieben Paper von Forschenden des DFKI und der TU Berlin angenommen. Große Mengen hochwertiger Daten sind das Rückgrat moderner Machine-Learning-Anwendungen in Forschung, Industrie und Bereichen wie Medizin und Mobilität. Um die nächste Generation von Anwendungen der Künstlichen Intelligenz zu ermöglichen, müssen immer mehr unterschiedliche Datenquellen in kürzerer Zeit abgerufen und analysiert werden, während gleichzeitig die Rechenkosten reduziert, die Fehlertoleranz beibehalten und eine hohe Datenqualität erreicht werden soll. Der DFKI-Forschungsbereich Intelligente Analytik für Massendaten (IAM) unter der Leitung von Prof. Dr. Volker Markl hat sich mit einigen dieser Herausforderungen im Datenmanagement auseinandergesetzt und innovative Lösungen entwickelt.

Sechs Full-Research-Papers und ein Industrial-Paper von DFKI-Forschenden zu Datenmanagement-Themen wurden auf der SIGMOD 2021 angenommen. "Die Annahme einer so hohen Anzahl von Papers aus einer deutschen Forschungsgruppe bei der SIGMOD ist außergewöhnlich. Ich bin sehr stolz auf diesen Erfolg und die internationale Anerkennung unserer Forschungsleistung", sagt Volker Markl.

Zwei der Publikationen sind das Ergebnis internationaler Forschungskooperationen. Eines dieser Papiere ist auf eine gemeinsame Arbeit mit Kolleg*innen der East China Normal University in Shanghai zurückzuführen. Die Autor*innen schlagen HyMAC vor, ein System, das es ermöglicht, iterative maschinelle Lernalgorithmen auf verteilten Datenflusssystemen effizienter auszuführen. Der Ansatz hat das Potenzial, den Prozess des maschinellen Lernens mit Daten aus Milliarden von Datenpunkten zu beschleunigen, indem er die Kommunikationskosten in Datenflusssystemen, wie z. B. Apache Flink, reduziert.

Die andere internationale Zusammenarbeit führte zu einer Veröffentlichung, die auf Arbeiten im Projekt ExDRa (Exploratory Data Science on Raw Data) basiert, das gemeinsam mit Forschenden des DFKI und der TU Berlin, der Siemens AG, der TU Graz und der Know-Center GmbH durchgeführt wurde. Dieses Paper wurde im SIGMOD Industrial Track angenommen. Das ExDRa-System wurde entwickelt, um den explorativen Data-Science-Prozess über heterogenen und verteilten Daten zu unterstützen. Typischerweise schlagen Datenwissenschaftler*innen in der Industrie Hypothesen vor und bewerten sie, integrieren die notwendigen Daten und führen Modelle aus, um interessante Muster zu identifizieren. Um diesen Prozess zu unterstützen, untersucht ExDRa, wie ein System entworfen und aufgebaut werden kann, das Unterstützung bietet und hilft, die Analyse von Problemen zu optimieren, die in verschiedenen Siemens-Anwendungsfällen (z.B. Chemie, Pharma, Wasser, Öl, Gas) auftreten. Dazu nutzt das Projekt das IoT-Datenmanagementsystem NebulaStream.

Beitrag teilen auf:

Kontakt:

Martin Pagel

Researcher, DFKI Berlin

Pressekontakt:

Andreas Schepers, M.A.

Unternehmenskommunikation, DFKI Berlin

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence