Skip to main content Skip to main navigation

Research Paper von TU Berlin and DFKI bei der CIDR 2021 angenommen

| Data Management & Analysis | Intelligente Analytik für Massendaten | Berlin

Forschende der Gruppe Datenbanksysteme und Informationsmanagement (DIMA) an der TU Berlin und des Forschungsbereichs Intelligente Analytik für Massendaten (IAM) am DFKI wurden informiert, dass ihre Forschungsarbeiten für die Präsentation bei der 11th Annual Conference on Innovative Data Systems Research (CIDR ’21) angenommen wurden, welche von 11. – 15.01.2021 als virtuelles Event stattfinden wird.

Das Visionspapier "The Case for Distance-Bounded Spatial Approximations" von Eleni Zacharatou, Andreas Kipf, Ibrahim Sabek, Varun Pandey, Harish Doraiswamy und Volker Markl plädiert für approximative räumliche Datenverarbeitungstechniken, die auf exakte geometrische Tests verzichten und endgültige Antworten ausschließlich auf der Basis von (feinkörnigen) Näherungen liefern. Dank jüngster Hardware-Fortschritte kann diese Vision heute realisiert werden. Darüber hinaus verwenden diese Näherungsverfahren eine abstandsbasierte Fehlergrenze, d.h. eine Grenze für den maximalen räumlichen Abstand zwischen falschen (oder fehlenden) und exakten Ergebnissen, die für aussagekräftige Analysen entscheidend ist. Diese Schranke erlaubt es, die Präzision der Approximation und die Handelsgenauigkeit für die Leistung zu kontrollieren.
Ein Preprint ist hier verfügbar.

Das Demopapier "Semi-Supervised Data Cleaning with Raha and Baran" von Mohammad Mahdavi und Ziawash Abedjan zeigt, wie zwei zuvor entwickelte Systeme, Raha und Baran, innerhalb einer End-to-End-Datenbereinigungs-Pipeline eingesetzt werden können. In der Praxis ist es mit einer kleinen Anzahl von 20 vom Benutzer kommentierten Tupels möglich, Datenqualitätsprobleme innerhalb eines Datensatzes effektiv zu identifizieren und zu beheben. Darüber hinaus profitieren beide Systeme vom Wissen über vorherige Bereinigungsaufgaben. Mit Hilfe des Transfer-Lernens können beide Systeme die anstehende Datenbereinigungsaufgabe im Hinblick auf die Laufzeit der Fehlererkennung und die Effektivität der Fehlerverbindung optimieren.

Um mehr über CIDR 2021 zu erfahren, besuchen Sie bitte http://cidrdb.org/cidr2021/index.html