Im digitalen Zeitalter ist die Wiederherstellung gelöschter Daten eine zentrale Herausforderung in der digitalen Forensik. Mit der stetigen Zunahme von Datenmengen und Speichermethoden stoßen herkömmliche Verfahren dabei an ihre Grenzen. Hier setzt das Forschungsprojekt Carve-DL an: Eine KI-gestützte Lösung, die schwer rekonstruierbare Dateien wiederherstellen kann und mithilfe lernender Algorithmen die Effizienz und Genauigkeit der digitalen Datenrekonstruktion nachhaltig verbessert.
Mehr über das Projekt auf der offiziellen Seite des DFKI: Projektseite Carve-DL
Traditionell arbeiten Forensiker mit standardisierten, oft manuellen Verfahren, um gelöschte Daten wiederherzustellen. Während diese Methoden auf festgelegten Dateisignaturen oder Metadaten des Dateisystems beruhen, geht Carve-DL neue Wege. Durch den Einsatz fortschrittlicher Deep-Learning-Technologien, insbesondere Swin Transformer V2 und ResNet kann die Software nicht nur vollständige Dateien wiederherstellen, sondern auch stark fragmentierte Daten rekonstruieren. Dies ermöglicht eine präzise Wiederherstellung selbst in Fällen, in denen hergebrachte Techniken scheitern.
Carve-DL richtet sich an Spezialisten der digitalen Forensik, die gelöschte oder zerstückelte Daten rekonstruieren müssen. Ein Beispiel ist die Wiederherstellung automatisch gelöschter Cache-Daten von Webseiten, die für Ermittlungen von Bedeutung sind. Auch manipulierte oder absichtlich zerstörte digitale Beweismittel können durch die KI rekonstruiert werden.
Weitere Hintergründe zu Carve-DL in der kriminalistischen Anwendung finden Sie im Artikel: Carve-DL: Künstliche Intelligenz in der Kriminalitätsbekämpfung
Anhand einer fiktiven Kriminalgeschichte zeigt das begleitende Erklärvideo, wie die Rekonstruktion gelöschter Bilddaten durch Carve-DL funktioniert. In dem erfundenen Szenario wird die Mona Lisa gestohlen, und alle digitalen Spuren der Tat gelöscht. Das Video veranschaulicht, wie Carve-DL aus fragmentierten Speicherdaten des Diebes die ursprüngliche Aufnahme des gestohlenen Gemäldes rekonstruiert und damit eine forensische Analyse ermöglicht.
Dieses Beispiel soll den praktischen Nutzen der entwickelten KI-Methoden verdeutlichen: Das System kann gelöschte Bildfragmente identifizieren, klassifizieren, gruppieren und korrekt anordnen – ein Prozess, der auch bei realen digitalen Beweismitteln entscheidend sein kann.
Seit Projektbeginn im November 2022 wurden bedeutende Fortschritte erzielt und der KI-Workflow sukzessive verfeinert, um so den komplexen Anforderungen der digitalen Forensik und der Datenrekonstruktion gerecht zu werden :
Durch den Einsatz von Swin Transformer V2 und ResNet wurde die Effizienz des Systems erheblich gesteigert. Insbesondere durch Supportive Clustering with Contrastive Learning (SCCL) konnte die Clustering-Genauigkeit auf etwa 85 % erhöht werden.
Eine der größten Herausforderungen im Projektverlauf war die unbestimmte Anzahl und Beschaffenheit der zu rekonstruierenden Fragmente. Carve-DL hat dieses Problem gelöst, indem die Ungewissheit bereits früh in der Pipeline durch iteratives Clustering bearbeitet wird.
Ein weiteres Problem bestand in der skalierbaren und effizienten Neuordnung der Fragmente. Um diese Probleme zu adressieren, wurde eine Kombination aus digitaler Signalverarbeitung und Low-Rank-Approximation (LoRA) integriert, um Rechenressourcen effizienter zu nutzen.
Neben der polizeilichen Ermittlungsarbeit bietet Carve-DL Potenzial für weitere Bereiche:
Mit der nahenden Beendigung des Projekts Carve-DL im Oktober 2025 zieht das Forschungsteam eine positive Bilanz. Die entwickelten Technologien zeigen, dass KI-basierte Datenrekonstruktion die digitale Forensik revolutionieren kann. Durch innovative Methoden ist es möglich, gelöschte oder fragmentierte Daten mit bislang unerreichter Präzision wiederherzustellen.
Weitere Informationen und aktuelle Entwicklungen: www.carve-dl.de
Teamleiter "GeT-AI" im Forschungsbereich Smarte Daten & Wissensdienste, DFKI
Redakteur & Referent für Öffentlichkeitsarbeit, DFKI