Skip to main content Skip to main navigation

Projekt | NFDI4DataScience

Laufzeit:
NFDI4DataScience and AI

NFDI4DataScience and AI

Forschungsthemen

Die Vision von NFDI4DataScience (NFDI4DS) ist es, alle Schritte des komplexen und interdisziplinären Forschungsdatenlebenszyklus zu unterstützen, einschließlich der Erfassung und Erstellung, Verarbeitung, Analyse, Veröffentlichung, Archivierung und Wiederverwendung von Ressourcen in Data Science und Künstlicher Intelligenz.

In den letzten Jahren hat ein Paradigmenwechsel stattgefunden: Computergestützte Methoden setzen zunehmend auf datengetriebene und oft auf Deep Learning basierende Ansätze. Dies hat zur Etablierung von Data Science als Disziplin geführt, die von Fortschritten in der Informatik angetrieben wird. Transparenz, Reproduzierbarkeit und Fairness sind aufgrund der Komplexität moderner Data-Science-Methoden, die oft auf einer Kombination aus Code, Modellen und Trainingsdaten basieren, zu entscheidenden Herausforderungen für Data Science und Künstliche Intelligenz geworden. NFDI4DS fördert faire und offene Forschungsdateninfrastrukturen und unterstützt alle beteiligten Ressourcen wie Code, Modelle, Daten oder Publikationen durch einen integrierten Ansatz.

Das übergeordnete Ziel von NFDI4DS ist die Entwicklung, der Aufbau und der Betrieb einer nationalen Forschungsdateninfrastruktur (NFDI) für die Data-Science- und Künstliche-Intelligence-Community in Deutschland. Dies wird auch einer breiteren Community, die Datenanalyselösungen benötigt, innerhalb und außerhalb der NFDI Vorteile bringen. Die Kernidee besteht darin, die Transparenz, Reproduzierbarkeit und Fairness von Data-Science- und Künstliche-Intelligenz-Projekten zu erhöhen, indem alle digitalen Artefakte verfügbar gemacht, miteinander verknüpft und innovative Werkzeuge und Dienste angeboten werden. Durch die Wiederverwendung dieser digitalen Objekte ermöglicht dies neue und innovative Forschung.

NFDI4DS möchte die Data-Science- und Künstliche-Intelligenz-Community in der Wissenschaft vertreten, einem interdisziplinären Feld mit Wurzeln in der Informatik. Wir streben die Wiederverwendung bestehender Lösungen und eine enge Zusammenarbeit mit den anderen NFDI-Konsortien und darüber hinaus an. In der Anfangsphase konzentriert sich NFDI4DS auf vier datenwissenschaftliche Anwendungsbereiche: Sprachtechnologie, Biomedizin, Informationswissenschaften und Sozialwissenschaften. Die in NFDI4DS vorhandene Expertise stellt sicher, dass Metadatenstandards domänenübergreifend interoperabel sind und neue Wege im Umgang mit digitalen Objekten entstehen.

Publikationen

Alle Publikationen
  1. Table Understanding and (Multimodal) LLMs: A Cross-Domain Case Study on Scientific vs. Non-Scientific Data

    Ekaterina Borisova; Fabio Barth; Nils Feldhus; Raia Abu Ahmad; Malte Ostendorff; Pedro Ortiz Suarez; Georg Rehm; Sebastian Möller

    In: Chang Shuaichen; Hulsebos Madelon; Liu Qian; Chen Wenhu; Sun Huan (Hrsg.). Proceedings of the 4th Table Representation Learning Workshop. Annual Meeting of the Association for Computational Linguistics (ACL), located at ACL 2025, July 31, Vienna, Austria, Pages 109-142, ISBN 979-8-89176-268-8, Association for Computational Linguistics, 2025.
  2. SciVQA 2025: Overview of the First Scientific Visual Question Answering Shared Task

    Ekaterina Borisova; Nikolas Rauscher; Georg Rehm

    In: Tirthankar Ghosal; Philipp Mayr; Amanpreet Singh; Aakanksha Naik; Georg Rehm; Dayne Freitag; Dan Li; Sonja Schimmler; Anita De Waard (Hrsg.). Proceedings of the Fifth Workshop on Scholarly Document Processing (SDP 2025). Annual Meeting of the Association for Computational Linguistics (ACL), located at ACL 2025, Vienna, Austria, Pages 182-210, ISBN 979-8-89176-265-7, Association for…
  3. FoRC4CL: A Fine-grained Field of Research Classification and Annotated Dataset of NLP Articles

    Raia Abu Ahmad; Ekaterina Borisova; Georg Rehm

    In: Nicoletta Calzolari; Min-Yen Kan; Veronique Hoste; Alessandro Lenci; Sakti Sakriani; Nianwen Xue (Hrsg.). Proceedings of the Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). International Conference on Language Resources and Evaluation (LREC-2024), May 20-25, Turino, Italy, Italy, European Language Resources Association (ELRA),…

Fördergeber

DFG - Deutsche Forschungsgemeinschaft

DFG - Deutsche Forschungsgemeinschaft