Diese Forschungsarbeit ist das Ergebnis einer Kollaboration von Forschenden des Forschungsbereichs Intelligente Analytik für Massendaten (IAM) des DFKI, des Fachbereichs Datenbanksysteme und Informationsmanagement (DIMA) an der TU Berlin, des Department of Computer Science an der National University of Singapore (NUS) und ByteDance.
Die jährliche ACM SIGMOD/PODS-Konferenz ist ein führendes internationales Forum für Forschende, Anwendender*innen, Entwickler*innen und Nutzer*innen von Datenbanken, um sich über Ergebnisse, Techniken, Tools und Erfahrungen in allen Aspekten von Datenmanagement auszutauschen. Um mehr über ACM SIGMOD/PODS zu erfahren, besuchen Sie bitte https://2021.sigmod.org/.
Abstract:
The intra-window join (IaWJ), i.e., joining two input streams over a single window, is a core operation in modern stream processing applications. This paper presents the first comprehensive study on parallelizing the IaWJ on modern multicore architectures. In particular, we classify IaWJ algorithms into lazy and eager execution approaches. For each approach, there are further design aspects to consider, including different join methods and partitioning schemes, leading to a large design space. Our results show that none of the algorithms always performs the best, and the choice of the most performant algorithm depends on: (i) workload characteristics, (ii) application requirements, and (iii) hardware architectures. Based on the evaluation results, we propose a decision tree that can guide the selection of an appropriate algorithm.
Eine Preprint-Version des Papers (PDF) steht zum Download zur Verfügung