Ein barrierefreier europäischer digitaler Binnenmarkt ist ein ausgesprochenes Ziel der EU für 2020. Die META-NET-Weißbücher über Sprachen zeigen, dass derzeit nur drei der 27 EU-Sprachen moderate bis gute Unterstützung durch Technologien der maschinellen Übersetzung (MÜ) genießen. Eher schwache oder bestenfalls fragmentarische Unterstützung besteht für die überwiegende Mehrheit der EU-Sprachen. Dieser Mangel stellt ein wesentliches Hindernis für den freien Verkehr von Menschen, Information und Waren im europäischen Binnenmarkt dar.
Viele der im Hinblick auf MÜ technologisch wenig unterstützten Sprachen weisen gemeinsame Merkmale auf: sie sind morphologisch komplex und haben relativ freie und dabei sehr unterschiedliche Wortstellung. Oft gibt es für sie nicht ausreichend Trainingsmaterial oder Verarbeitungskomponenten. Insgesamt führt dies zu einer drastisch schlechteren Übersetzungsqualität. Die kombinierte Herausforderung durch linguistische Phänomene und Ressourcen-Szenarios bewirkt eine große und wenig erforschte graue Fläche auf der Sprachtechnologie-Karte der europäischen Sprachen. Mit einem gemeinsamen Vorgehen wichtiger Interessenvertreter bearbeitet QT21 diese graue Fläche und entwickelt
- substantiell verbesserte statistische und auf maschinellem Lernen beruhende Übersetzungsmodelle für "schwierige" Sprachen und Ressourcen-Szenarios,
- verbesserte Evaluationsmethoden mit kontinuierlichem Lernen aus Fehlern, die durch eine systematische Analyse von Qualitätshindernissen gesteuert und durch Information von Übersetzern gespeist werden,
- alles mit einem Schwerpunkt auf Skalierbarkeit, so dass das Lernen und Dekodieren mit diesen Modellen effizient bleibt und die Abhängigkeit von Daten (ob annotiert oder nicht) minimiert wird.
Um den Projektfortschritt kontinuierlich zu messen und um eine Plattform für Disseminierung und Zusammenarbeit zu bieten (innehalb von QT21 und außerhalb), steht im Mittelpunkt des Projekts eine Reihe von Shared Tasks, die zwecks maximaler Wirkung zusammen mit den jährlich stattfindenden MÜ-Workshops (WMT) organisiert werden.
Das Projekt QT21 hat Fördermittel des Forschungsprogramms "Horizon 202" der Europäischen Union unter dem Förderkennzeichen 645452 erhalten.
Partner
- Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Germany, Co-ordinator
- Rheinisch-Westfälische Technische Hochschule Aachen, Germany
- Universiteit van Amsterdam, Netherlands
- Dublin City University, Ireland
- The University Of Edinburgh, United Kingdom
- Karlsruher Institut für Technologie, Germany
- Centre National de la Recherche Scientifique, France
- Univerzita Karlova v Praze, Czech Republic
- Fondazione Bruno Kessler, Italy
- The University of Sheffield, United Kingdom
- Taus Bv, Netherlands
- Text & Form GmbH, Germany
- Tilde Sia, Latvia
- Hong Kong University of Science and Technology, Hong Kong