Das Paper mit dem Titel "Pump Up the Volume: Processing Large Data on GPUs with Fast Interconnects," von Clemens Lutz, Sebastian Breß, Steffen Zeuch, Tilmann Rabl (jetzt am HPI) und Volker Markl beschäftigt sich mit dem Einsatz von GPUs zur Beschleunigung der Verarbeitung von Datenbankabfragen.
GPUs sind im Allgemeinen aus zwei Gründen für die Verarbeitung großer Datenmengen ungeeignet: (1) die integrierte Speicherkapazität ist zu klein, um große Datensätze zu speichern, und (2) die Verbindungsbandbreite zum CPU-Hauptspeicher reicht für Ad-hoc-Datenübertragungen nicht aus. Infolgedessen stehen GPU-fähige Systeme vor einem Datentransfer-Engpass und lassen sich nicht auf große Datensätze skalieren.
In diesem Artikel untersuchen die Autoren, wie eine schnelle Verbindung wie NVLink 2.0 (die dedizierte GPUs mit einer CPU verbindet) die beiden Skalierbarkeitsprobleme überwinden kann. Folglich zeigen sie in ihren Experimenten, dass eine Hash-Verbindung ohne Partitionierung eine bis zu 18-fache Beschleunigung gegenüber PCI-e 3.0 und eine bis zu 7,3-fache Beschleunigung gegenüber einer optimierten CPU-Implementierung erreicht.
Einen Vorabdruck des Papiers können Sie hier herunterladen: https://bit.ly/3bHb3XO