Skip to main content Skip to main navigation

DFKI und Inria entwickeln robuste KI für Gebärdensprachübersetzung

| Mensch Maschine Interaktion | Sprache & Textverstehen | Sprachtechnologie und Multilingualität | Saarbrücken | Berlin | Pressemitteilung

Das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) und das französische Informatik-Institut Inria bündeln ihre Expertise, um die nächste Generation von Gebärdensprach-Systemen zu entwickeln. Im gemeinsamen Projekt RoGSiLT (Robust and Generalizable Sign Language Translation) entstehen KI-basierte Lösungen für die Deutsche und Französische Gebärdensprache (DGS und LSF). Ziel ist es, innovative Methoden der Künstlichen Intelligenz zu entwickeln, die Übersetzungen zwischen gesprochener Sprache und Gebärdensprache deutlich verbessern. Damit soll die Teilhabe gehörloser und schwerhöriger Menschen am öffentlichen Leben gestärkt werden.

Bestehende Gebärdensprach-Systeme können bereits gesprochene oder geschriebene Sprache in Gebärdensprache übertragen und mithilfe von Avataren visualisieren. In der Praxis stoßen sie an Grenzen: Mimik und Körpersprache werden oft nur ungenau wiedergegeben, Bedeutungsaspekte gehen verloren und die Darstellung wirkt häufig unnatürlich.

Das auf drei Jahre angelegte Projekt setzt genau hier an: Es verbessert sowohl die Übersetzung von Text in Gebärdensprache als auch die Umwandlung von Gebärdensprache aus Videos in geschriebene Sprache. Durch moderne Verfahren wie multimodale neuronale Netze, selbstüberwachtes Lernen und große Sprachmodelle sollen bestehende Hürden – etwa begrenzte Datenverfügbarkeit, mangelnde Generalisierbarkeit und unnatürliche Übersetzungen – überwunden werden. Ein wichtiger Baustein ist der Aufbau neuer Datenressourcen, darunter umfangreiche parallele Korpora aus Gebärdensprach-Videos und damit verknüpften Texten.

Projektleiter Dr. Eleftherios Avramidis, FB Kognitive Assistenzsysteme, DFKI Berlin

„Unser Ziel ist es, robuste und natürlich wirkende Übersetzungssysteme zu entwickeln, die im Alltag nutzbar sind. Mit neuen KI-Modellen, die verschiedene Informationen wie Bild und Bewegung gleichzeitig verarbeiten, sowie verbesserten Methoden zur Aufbereitung von Trainingsdaten bringen wir die Gebärdensprachübersetzung einen wichtigen Schritt voran und erweitern den Stand der Technik.“

Projektleiter Dr. Eleftherios Avramidis, FB Kognitive Assistenzsysteme, DFKI Berlin

Wissenschaftliche und gesellschaftliche Ziele

Am Ende des Projekts steht ein Prototyp für automatische Übersetzungen in beide Richtungen – zwischen Deutsch und DGS sowie Französisch und LSF. Die gebärdende Ausgabe erfolgt über einen Avatar, der Inhalte realistisch mit Ganzkörperbewegungen, Mimik und emotionalem Ausdruck darstellt.

Neben wissenschaftlichen Fortschritten verfolgt RoGSiLT ein klares gesellschaftliches Ziel: Die entwickelten Technologien sollen Barrieren abbauen und neue Kommunikationsmöglichkeiten eröffnen – in Bildung, Arbeitswelt und beim Zugang zu Informationen. Damit leistet das Projekt einen Beitrag zur Umsetzung europäischer und internationaler Strategien für Inklusion und Barrierefreiheit, wie dem European Accessibility Act und der UN-Behindertenrechtskonvention.

Starke Partnerschaft mit komplementärer Expertise

RoGSiLT ist bereits das neunte gemeinsame Projekt von DFKI und Inria. Die Zusammenarbeit baut auf vorhandenen Stärken auf: Beide Partner bringen umfangreiche Datensätze ein – darunter Gebärdensprachdaten aus früheren Forschungsprojekten sowie mehr als 300 Stunden Videomaterial aus Nachrichtensendungen. Gleichzeitig ergänzen sich die fachlichen Schwerpunkte: Während Inria besondere Expertise im maschinellen Lernen und in gesprochener Sprache besitzt, verfügt das DFKI über langjährige Erfahrung in der Modellierung von Gebärdensprach-Elementen.

Transfer in Wirtschaft und Gesellschaft

Ein besonderer Schwerpunkt liegt auf der Zusammenarbeit mit der Gehörlosen-Community, die aktiv in Entwicklung und Evaluation eingebunden wird. Die entwickelten Systeme werden gemeinsam mit Nutzerinnen und Nutzern erprobt und bewertet, um ihre Alltagstauglichkeit sicherzustellen. Alle wesentlichen Projektergebnisse werden als Open Source zugänglich gemacht, um Innovationen in Forschung und Industrie weiter voranzutreiben und die Entwicklung inklusiver Technologien oder die Bereitstellung barrierefreier Inhalte nachhaltig zu fördern.

Die Ergebnisse des Projekts versprechen nicht nur bessere Zugänge zu Bildung, Arbeitsmarkt und gesellschaftlicher Teilhabe für gehörlose Menschen, sondern bieten zugleich konkrete Vorteile für öffentliche Institutionen, Medien, das Gesundheitswesen und die Wirtschaft – indem sie Kommunikation erleichtern und barrierefreie Dienstleistungen verbessern.

Kontakt:

Dr. Eleftherios Avramidis

Forschungsbereich Kognitive Assistenzsysteme, DFKI

Pressekontakt:

Heike Leonhard, M.A.

Communications & Media, DFKI Saarbrücken