Skip to main content Skip to main navigation

Project | AnoMed-II

Duration:
Anonymisierungslösungen für medizinische Anwendungen

Anonymisierungslösungen für medizinische Anwendungen

Application fields

Die Menge sensibler medizinischer Daten aus Krankenversorgung, elektronischer Patientenakte (ePA) und digitalen Gesundheitsanwendungen wächst rasant. Gleichzeitig sollen diese Daten im Rahmen des Europäischen Gesundheitsdatenraums (EHDS) für gemeinwohlorientierte Forschung sekundär genutzt werden. Diese Nutzung unterliegt jedoch besonders strengen Datenschutzanforderungen: Daten müssen sicher verarbeitet und Studienergebnisse anonymisiert veröffentlicht werden. Dafür sind neue Anonymisierungslösungen erforderlich, die modernen Angriffen standhalten und dennoch eine hohe wissenschaftliche Nützlichkeit erlauben. AnoMed-II, das Folgeprojekt des AnoMed‑Clusters, baut auf der bestehenden Benchmarking‑Plattform für medizinische Privacy‑Challenges auf und erweitert diese um neue Challenges, privacy‑preserving Datensynthese und zugehörige Angriffs‑ und Bewertungsverfahren. Die Plattform wird zu einer aktiven Challenge‑Plattform weiterentwickelt, auf der Forschende sowie Akteure aus Medizin und Medizintechnik Anonymisierungs‑ und Syntheselösungen ebenso wie gezielte Deanonymisierungsangriffe einbringen können. Klassische Anonymisierungsansätze wie k‑Anonymität oder aggregierte Statistiken erweisen sich als unzureichend, während Verfahren mit starken mathematischen Garantien wie Differential Privacy häufig mit erheblichen Einbußen an Nützlichkeit verbunden sind. Zentrales Forschungsthema ist daher der inhärente Utility‑Privacy‑Tradeoff: Anonymisierungslösungen sollen nur so viel Nützlichkeit wie nötig aufgeben, ohne den Schutz unter ein kritisches Niveau abzusenken.

Beiträge des DFKI

Das DFKI leistet Beiträge zur methodischen Grundlagenforschung im Bereich privacy‑preserving Machine Learning und Datensynthese. Im Projekt werden privacy‑friendly Merkmalsextraktionsverfahren für Differential‑Privacy‑Modelle entworfen und systematisch analysiert, insbesondere im Hinblick auf Datensatzeigenschaften, die für DP‑basierte Verfahren besonders geeignet sind. Darüber hinaus entwickelt das DFKI generative Modelle auf Basis von zufälligen Projektionen sowie probabilistischen relationalen Modellen für die Privatsphäre-wahrende Synthese komplexer medizinischer Daten. Die erzeugten synthetischen Datensätze sollen realistische statistische und strukturelle Eigenschaften aufweisen und für nachgelagerte Anwendungen wie Methodenentwicklung, Validierung von Analyseverfahren, Benchmarking, Training von KI‑Modellen und die Evaluation von Privacy‑Angriffen genutzt werden können, ohne Rückschlüsse auf einzelne Patientinnen und Patienten zuzulassen.

Funding Authorities

BMFTR - Federal Ministry of Research, Technology and Space

16KIS2490

BMFTR - Federal Ministry of Research, Technology and Space