Publication
FAIR Data Publisher. Strategie für den flächendeckenden Einsatz von FAIR Digital Objects
Marius Bensley; Philippe Calvez; Christian Backe; Patrick Draheim; Veit Briken; Anna Petschulies; Fabian Rack; Franziska Boehm; Jan Nagler; Christina Gillmann; Christoph Lange-Bever; Daham Mustafa; Joshua Gelhaar; Maik Mannsfeld; Michael Steinert; Zeyd Boukhers; Jana Böhm; Philipp Wieder; Sonja Sternkopf; Sven Bingert; Suat Can; Henrik tom Wörden; Insa Nüske; Sina Rohde; Timm Fitschen; Oliver Rack; Frank Tristram; Ashley Caselli; Philipp von Essen; Tobias Kuhn; Virginia Balseiro; Ziroli Plutschow; Igor Garmaev; Marius Politze; Torben Miny; David Wagner; Hans-Günther Döbereiner; Lennard Scheurer; Lukas Schmidt; Malte Ohmstede; Robert Porzel; Torben Klarl; Mario Martini; Tom Schuchort; Nils Niendorf
11/2025.
Abstract
Der FAIR Data Publisher stellt eine zentrale technologische Initiative dar, um die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit von Daten bedeutend zu verbessern. Dieses Projekt ist nicht nur ein technisches Werkzeug, sondern trägt zu einer wichtigen Entwicklung in der deutschen und europäischen Dateninfrastruktur bei, die von einem Konsortium aus mehreren namhaften Organisationen gemeinsam vorangetrieben wird.
Das Herzstück des FAIR Data Publisher ist die Implementierung von FAIR Digital Objects (FDOs). Ein FDO ist ein digitaler Container, der nicht nur die eigentlichen Daten enthält, sondern diese untrennbar mit reichhaltigen Metadaten und einem persistenten Identifikator (PID) verknüpft. Dieser PID, ähnlich einer ISBN für Bücher, sorgt dafür, dass das Datenobjekt dauerhaft und eindeutig adressierbar bleibt, selbst wenn sich sein Speicherort ändert. Der FAIR Data Publisher ist ein Satz an Softwares, die den Prozess der Erstellung, Verwaltung und Veröffentlichung dieser FDOs vereinfachen. Er bietet eine benutzerinnen- und benutzerfreundliche Schnittstelle, die es auch Fachexpertinnen und -experten ohne tiefgreifende IT-Kenntnisse ermöglicht, ihre Daten nach den FAIR-Prinzipien aufzubereiten und in verteilten Datenräumen sicher und nachvollziehbar zu teilen. Er fungiert als Einstiegspunkt in eine vernetzte und intelligente Datenökonomie.
Das Projekt MISSION KI – Nationale Initiative für Künstliche Intelligenz und Datenökonomie der acatech – Deutsche Akademie der Technikwissenschaften, gefördert durch das Bundesministerium für Digitales und Staatsmodernisierung dient als zentrales Hebelprojekt der Digitalstrategie, um die digitale Wettbewerbsfähigkeit Deutschlands zu stärken und eine vertrauenswürdige KI „Made in Germany“ zu etablieren.
Die Initiative konzentriert sich auf drei strategische Säulen: Erstens die Verbesserung der Datenbasis für KI durch die Förderung der Vernetzung von Datenräumen über Sektoren- und Ländergrenzen hinweg sowie die Entwicklung von Open Source Services zur besseren Auffindbarkeit und Nutzung von Daten. Zweitens die Stärkung der Entwicklung vertrauenswürdiger KI durch die Implementierung eines freiwilligen, praxistauglichen KI-Qualitätsstandards und die Einrichtung von KI-Innovations- & Qualitätszentren, um das Vertrauen der Anwender zu erhöhen. Drittens die Unterstützung des Wachstums von KI-Innovationen durch Programme wie das AI Founder Fellowship und die gezielte Zusammenführung von KMU und KI-Startups, um den Transfer von Spitzenforschung in die wirtschaftliche Praxis zu beschleunigen.
Im Rahmen der Säule 1 hat sich MISSION KI zur Förderung der Vernetzung von Datenräumen der Entwicklung einer Architektur auf Basis von FAIR Digital Objects verschrieben und den FAIR Data Publisher ins Leben gerufen. Acatech treibt bereits seit Jahren die Vision einer souveränen und föderalen Dateninfrastruktur für Deutschland und Europa voran, prominent sichtbar im Gaia-X-Projekt. Der FAIR Data Publisher ist eine konkrete, praxisnahe Umsetzung dieser Vision. Er liefert die grundlegende Technologie, um Datenräume mit hochwertigen, interoperablen und vertrauenswürdigen Daten zu füllen.
Für die MISSION KI ist der FAIR Data Publisher von essenzieller Bedeutung. Künstliche Intelligenz ist auf riesige Mengen qualitativ hochwertiger und zugänglicher Trainingsdaten angewiesen. Oft scheitern KI-Projekte am Mangel solcher Daten oder an dem enormen Aufwand, heterogene Datensätze nutzbar zu machen. Indem der FAIR Data Publisher Daten von vornherein in einem standardisierten, maschinenlesbaren und interoperablen Format bereitstellt, legt er das Fundament für die Entwicklung und Skalierung von KI-Anwendungen in Deutschland.
