en
DORIAN: Auf dem Weg zum unterstützten Design von Data Science Pipelines
Der Aufbau effektiver Data-Science-Pipelines ist mit zahlreichen Herausforderungen verbunden. Dazu gehören die Wartbarkeit der Pipelines, die geringe Standardisierung der Bibliotheken des Data-Science-Toolkits und die impliziten Annahmen, die die Leistung der Pipelines beeinflussen (z. B. welcher Algorithmus oder welche Hyperparameter für die vorliegenden Daten besser geeignet sind). Dies führt zu einer beträchtlichen Lernkurve, bei der Endbenutzer, einschließlich erfahrener Praktiker und ML-Experten, oft überfordert sind.
DORIAN ist ein intelligenter Assistent, der auf die Bedürfnisse der Endnutzer zugeschnittene Data-Science-Pipelines vorschlägt. Er bietet eine Umgebung mit wenig bis gar keinem Code, ist erweiterbar und verbessert die Qualität der Empfehlungen im Laufe der Zeit über Teams und Bereiche hinweg.
Da sich das DFKI auf industrielle Anwendungsfälle konzentriert, die sich durch eine große Vielfalt an Anwendungsbereichen, unterschiedliche Fachkenntnisse der Beteiligten und offene Forschungsinitiativen auszeichnen, eignet sich DORIAN als Hilfsmittel, um die Produktivität der Teams zu steigern und Einblicke in die nächste Generation von Data-Science-Pipelines und KI-Modellen zu bieten.
Im Vergleich zu bestehenden Ansätzen geht DORIAN zwei kritische Herausforderungen an: die einfache Erweiterbarkeit und die Vielfalt des Wissens, das DORIAN nutzt, um daraus zu lernen und sich im Laufe der Zeit zu verbessern. Die Besucher erhalten Zugang zum Arbeitsbereich von DORIAN und erkunden dessen Potenzial, Empfehlungen für die Gestaltung effektiver Data-Science-Pipelines zu geben.
Sergey Redyuk
Forschungsbereich Data Science und ihre Anwendungen
sergey.redyuk@dfki.de
Tel.: +49 1522 6707355