Das Visionspapier "The Case for Distance-Bounded Spatial Approximations" von Eleni Zacharatou, Andreas Kipf, Ibrahim Sabek, Varun Pandey, Harish Doraiswamy und Volker Markl plädiert für approximative räumliche Datenverarbeitungstechniken, die auf exakte geometrische Tests verzichten und endgültige Antworten ausschließlich auf der Basis von (feinkörnigen) Näherungen liefern. Dank jüngster Hardware-Fortschritte kann diese Vision heute realisiert werden. Darüber hinaus verwenden diese Näherungsverfahren eine abstandsbasierte Fehlergrenze, d.h. eine Grenze für den maximalen räumlichen Abstand zwischen falschen (oder fehlenden) und exakten Ergebnissen, die für aussagekräftige Analysen entscheidend ist. Diese Schranke erlaubt es, die Präzision der Approximation und die Handelsgenauigkeit für die Leistung zu kontrollieren.
Ein Preprint ist hier verfügbar.
Das Demopapier "Semi-Supervised Data Cleaning with Raha and Baran" von Mohammad Mahdavi und Ziawash Abedjan zeigt, wie zwei zuvor entwickelte Systeme, Raha und Baran, innerhalb einer End-to-End-Datenbereinigungs-Pipeline eingesetzt werden können. In der Praxis ist es mit einer kleinen Anzahl von 20 vom Benutzer kommentierten Tupels möglich, Datenqualitätsprobleme innerhalb eines Datensatzes effektiv zu identifizieren und zu beheben. Darüber hinaus profitieren beide Systeme vom Wissen über vorherige Bereinigungsaufgaben. Mit Hilfe des Transfer-Lernens können beide Systeme die anstehende Datenbereinigungsaufgabe im Hinblick auf die Laufzeit der Fehlererkennung und die Effektivität der Fehlerverbindung optimieren.
Um mehr über CIDR 2021 zu erfahren, besuchen Sie bitte http://cidrdb.org/cidr2021/index.html