Skip to main content Skip to main navigation

Projekt | E2Data

Laufzeit:
European Extreme Performing Big Data Stacks

European Extreme Performing Big Data Stacks

Forschungsthemen

Anwendungsfelder

In der heutigen Welt werden die Daten vom lokalen Netzwerk oder von Edge-Geräten an einen Cloud-Anbieter gestreamt, der von einem Kunden gemietet wird, um die Datenausführung durchzuführen. Der Software-Stack von Big Data teilt den Ausführungsstrom anwendungs- und hardwareunabhängig in mehrere Aufgaben auf und sendet sie zur Verarbeitung auf den vom Kunden bezahlten Knoten. Wenn das Ergebnis nicht der strengen Drei-Sekunden-Geschäftsanforderung entspricht, hat der Kunde zwei Möglichkeiten: 1) Scale-Up (durch Aufrüstung der Prozessoren auf Knotenebene) 2) Scale-Out (durch Hinzufügen von Knoten zu ihren Clustern) oder 3) manuelle Implementierung von Code-Optimierungen, die für die zugrunde liegende Hardware spezifisch sind. Der Kunde hat jedoch nicht die finanziellen Möglichkeiten, dies zu erreichen. Im Idealfall möchte er seine Geschäftsanforderungen erfüllen, ohne sein Hardware-Budget zu strapazieren. Um den alarmierenden Bedenken hinsichtlich der Skalierbarkeit zu begegnen, investieren sowohl Endbenutzer als auch Anbieter von Cloud-Infrastrukturen (wie Google, Microsoft, Amazon und Alibaba) in heterogene Hardwareressourcen, die in der Lage sind, eine vielfältige Auswahl an Architekturen wie CPUs, GPUs, FPGAs und MICs zu nutzen, um die Leistung weiter zu steigern und gleichzeitig die steigenden Betriebskosten zu minimieren. Darüber hinaus entwickeln große Unternehmen wie Google trotz der derzeitigen Investitionen in heterogene Ressourcen eigene ASICs, wobei TensorFlow das Paradebeispiel ist.

E2Data bietet eine End-to-End-Lösung für die Bereitstellung großer Datenmengen an, die den Stand der Technik bei Infrastrukturdiensten voll ausnutzt und vorantreibt, indem sie eine bis zu zehnfache Leistungssteigerung bei bis zu 50% weniger Cloud-Ressourcen ermöglicht. E2Data wird ein neues Software-Paradigma für Big Data anbieten, das die maximale Ressourcennutzung für heterogene Cloud-Bereitstellungen erreicht, ohne die aktuellen Big Data-Programmierungsnormen zu beeinträchtigen (d.h. keine Code-Änderungen in der ursprünglichen Quelle). Die vorgeschlagene Lösung verfolgt einen schichtenübergreifenden Ansatz, indem sie eine vertikale Kommunikation zwischen den vier Hauptschichten von Big Data-Bereitstellungen (Anwendung, Big Data-Software, Scheduler/Cloud-Provider und Ausführungslaufzeit) ermöglicht.

Partner

The University of Manchester, Institute of Communications and Computer Systems, Neurocom Luxembourg, KALEAO Limited, Computer Technology Institute and Press "Diophantus" (CTI), Spark Works Limited, iProov Limited

Publikationen

  1. Efficient Compilation and Execution of JVM-Based Data Processing Frameworks on Heterogeneous Co-Processors

    Christos Kotselidis; Sotiris Diamantopoulos; Orestis Akrivopoulos; Viktor Rosenfeld; Katerina DOka; Hazeef Mohammed; Georgios Mylonas; Vassilis Spitadakis; Will Morgan; Juan Fumero; Foivos S. Zakkak; Michail Papadimitriou; Maria Xekalaki; Nikos Foutris; Athanasios Stratikopoulos; Nectarios Koziris; Ioannis Konstantinou; Ioannis Mytilinis; Constatinos Bitsakos; Christos Tsalidis; Christos Tselios; Nikolaos Kanakis; Clemens Lutz; Sebastian Breß; Volker Markl

    In: Design, Automation & Test in Europe. Design, Automation & Test in Europe (DATE-2020), March 9-13, Grenoble, France, IEEE, 2020.

Fördergeber

EU - Europäische Union

780245

EU - Europäische Union