Sprachtechnologien wie Sprachassistenten oder Chatbots unterstützen bereits heute viele Menschen und Unternehmen dabei, ihren Alltag effizienter zu gestalten. Durch den Einsatz von Künstlicher Intelligenz (KI) funktioniert die maschinelle Verarbeitung natürlicher Sprache mittlerweile auf einem sehr hohen Niveau. Sprachmodelle können bereits qualitativ anspruchsvolle Aufgaben wie das Erstellen von Zeitungsberichten oder das Führen von Kundendialogen übernehmen. Um die Innovationsmöglichkeiten für den europäischen Markt und insbesondere kleine und mittelständische Unternehmen zu erschließen, entsteht im Forschungsprojekt OpenGPT-X ein großes und leistungsstarkes Sprachmodell für Europa.
Mit der neuen Sprach-KI sollen durch Anwendungspartner intelligente Sprachanwendungen entstehen, die bestehende Lösungen deutlich verbessern und Unternehmen Raum für neue Produkte und Geschäftsmodelle bieten. Neben der Innovationskraft und Wettbewerbsfähigkeit soll OpenGPT-X auch den Datenschutz wahren. Die OpenGPT-X-Sprachanwendungen werden über die europäische Cloud-Initiative Gaia-X zur Verfügung gestellt, die derzeit nach europäischen Werten und Sicherheitsstandards ebenfalls unter Beteiligung des DFKI entsteht. Die neue Sprach-KI soll künftig in den drei Gaia-X-Domänen Mobilität, Finanzwirtschaft und Medien bereitgestellt werden.
Aufgrund der hohen technischen Anforderungen bzgl. der Rechenleistung lassen sich leistungsstarke Sprachmodelle bisher nur von Großunternehmen oder Konsortien umsetzen. Deshalb umfasst das Projektkonsortium vielfältige namhafte Partner: Während Fraunhofer IAIS gemeinsam mit dem DFKI sowie den Unternehmen Aleph Alpha und Alexander Thamm GmbH die KI-Modelle entwickeln wird, stellen das Forschungszentrum Jülich und die TU Dresden ihre Hochleistungsrechenkapazitäten zur Verfügung. Gemeinsam mit der 1&1 IONOS SE wird das DFKI die Integration in die Gaia-X-Infrastruktur betreuen. Domänenspezifische Daten für die Entwicklung der Modelle erhält das Projekt unter anderem von ControlExpert und dem WDR, die zudem für das Projekt Anwendungsfälle entwickeln.
Für den DFKI-Forschungsbereich Speech and Language Technology komplementiert das Projekt OpenGPT-X die bereits laufenden Aktivitäten auf europäischer Ebene, die sich auf Sprachgerechtigkeit im digitalen Raum und die Entwicklung einer Infrastruktur für das mehrsprachige Europa fokussieren: Während das European Language Grid (ELG) als Plattform für Sprachtechnologien und -unternehmen den Austausch in der Branche sowohl auf wirtschaftlicher als auch Forschungsebene befördert, entwickelt das Projekt European Language Equality (ELE) eine Agenda, deren Ziel die Herstellung digitaler Sprachgerechtigkeit in Europa ist – und zwar bis spätestens 2030. Digitale Sprachgerechtigkeit bedeutet, dass alle europäischen Sprachen in einem vergleichbaren Umfang durch Sprachtechnologien unterstützt werden sollen.
Prof. Dr. Georg Rehm, Projektleiter von OpenGPT-X am DFKI: „Die Entwicklung großer Sprachmodelle auf anderen Kontinenten in den vergangenen Jahren hat bewiesen, welches Potential Sprach-KI für Anwendungen im Alltag birgt. Durch die Vielfalt an Sprachen und den hohen Anspruch an Datenschutz ist die Entwicklung großer Sprachmodelle für Europa nicht nur eine besondere, sondern auch eine dringende Herausforderung und gleichzeitig eine große Chance für die europäische Gemeinschaft. Wir freuen uns, unsere langjährige Erfahrung in der Forschung an Sprachtechnologien in Europa in OpenGPT-X einbringen zu können.“
Übersicht
Das Projekt OpenGPT-X ist im Januar 2022 gestartet, die Laufzeit beträgt drei Jahre. Das Gesamtbudget umfasst 19 Mio. EUR, das Fördervolumen 14,9 Mio Euro.
Das OpenGPT-X Konsortium:
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. (Fraunhofer IAIS und Fraunhofer IIS; Konsortialführung), Aleph Alpha GmbH, Alexander Thamm GmbH, ControlExpert GmbH, Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Forschungszentrum Jülich GmbH, KI Bundesverband e.V., Technische Universität Dresden, Westdeutscher Rundfunk Köln Anstalt des öffentlichen Rechts, IONOS SE