Skip to main content Skip to main navigation

Projekt | CRACKER

Laufzeit:
Cracking the Language Barrier: Coordination, Evaluation and Resources for European MT Research

Cracking the Language Barrier: Coordination, Evaluation and Resources for European MT Research

Die europäische Forschungs-Community im Gebiet der maschinellen Übersetzung (MT) steht unter Erfolgsdruck – nicht nur in Bezug auf rechtliche Aspekte und übergeordnete Rahmenkonstrukte der Europäischen Union, z.B. den digitalen Binnenmarkt, sondern auch hinsichtlich der globalen Märkte und Geschäftswelt. Gleichzeitig kämpft die Forschungs-Community mit einem gewissen Ungleichgewicht zwischen dem Ausmaß der Herausforderungen und den zur Verfügung stehenden Ressourcen, insbesondere in Bezug auf Übersetzungen von oder in Sprachen, für die nur eine fragmentarische oder schlicht gar keine Unterstützung durch Technologien zur Verfügung steht.

CRACKER arbeitet an einer Verbesserung der MT-Forschung hinsichtlich Effizienz und Effektivität, indem erfolgreiche Beispiele aus anderen Forschungsgebieten angewendet werden, in denen gemeinsame Forschungsarbeiten und geteilte Ressourcen – geleitet durch Prinzipien wie Interoperabilität, Standardisierung, gemeinsame Herausforderungen und Metriken – zu Durchbrüchen geführt haben, die sonst nicht möglich gewesen wären. Der Kern dieser neuen Forschungs-, Entwicklungs- und Innovationsstrategie hin zu einer hochqualitativen maschinellen Übersetzung ist eine Gruppe von Projekten, die aus der Ausschreibung Horizon 2020, ICT 17 ("Cracking the language barrier") hervorgegangen sind sowie einige weitere bereits laufende Vorhaben wie z.B. QTLeap, LIDER und MLi. Diese Vorhaben werden durch META-QT unterstützt und zwar hinsichtlich Koordinierung, Evaluierung und Ressourcen.

Um die selbst gesteckten Ziele effizient zu erreichen, wird CRACKER auf existierenden EU-geförderten Projekten und Initiativen aufsetzen und diese erweitern. Hierzu zählen Evaluations-Kampagnen wie die Workshop-Serie zu Statistical Machine Translation (WMT) sowie die internationale Workshop-Reihe zu Spoken Language Translation (IWSLT). Zu nennen ist ebenfalls META-SHARE als offene Infrastruktur zum Verteilen von Sprachressourcen und MT-bezogenen Datensätzen, die in META-NET entwickelt und in QTLaunchPad erweitert worden ist. Auch Open-Source-bezogene Trainings- und Entwicklungs-Workshops sind geplant (MT Marathons). Koordinierung und Kommunikation sowie der Brückenbau zu den Anwendergruppen werden auf existierenden Netzwerken und Kommunikationsinfrastrukturen aufbauen, z.B. der Konferenzreihe META-FORUM.

Förderung: Das Projekt CRACKER wird gefördert durch das Forschungs- und Innovationsprogramm Horizon 2020 der Europäischen Union gefördert unter dem Grant Agreement Nr. 645357.

Partner

  • Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Germany
  • Charles University in Prague, Czech Republic
  • Evaluations and Language Resources Distribution Agency, France
  • Fondazione Bruno Kessler, Italy
  • Athena Research and Innovation Center in Information, Communication and Knowledge Technologies, Greece
  • University of Edinburgh, United Kingdom
  • University of Sheffield, United Kingdom

Publikationen zum Projekt

  1. Language Technology for Multilingual Europe: An Analysis of a Large-Scale Survey regarding Challenges, Demands, Gaps and Needs

    Georg Rehm; Stefanie Hegele

    In: Nicoletta Calzolari; Khalid Choukri; Christopher Cieri; Thierry Declerck; Sara Goggi; Koiti Hasida; Hitoshi Isahara; Bente Maegaard; Joseph Mariani; Hélène Mazo; Asuncion Moreno; Jan Odijk; Stelios Piperidis; Takenobu Tokunaga (Hrsg.). Proceedings of the 11th Language Resources and Evaluation Conference (LREC 2018). International Conference on Language Resources and Evaluation (LREC-2018),…
  2. CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies

    Daniel Zeman; Martin Popel; Milan Straka; Jan Hajic; Joakim Nivre; Filip Ginter; Juhani Luotolahti; Sampo Pyysalo; Slav Petrov; Martin Potthast; Francis Tyers; Elena Badmaeva; Memduh Gokirmak; Anna Nedoluzhko; Silvie Cinkova; Jan Hajic jr.; Jaroslava Hlavacova; Václava Kettnerová; Zdenka Uresova; Jenna Kanerva; Stina Ojala; Anna Missilä; Christopher D. Manning; Sebastian Schuster; Dima Taji Siva Reddy; Nizar Habash; Herman Leung; Marie-Catherine de Marneffe; Manuela Sanguinetti; Maria Simi; Hiroshi Kanayama; Valeria dePaiva; Kira Droganova; Héctor Martínez Alonso; Çağrı Çöltekin; Umut Sulubacak; Hans Uszkoreit; Vivien Macketanz; Aljoscha Burchardt; Kim Harris; Katrin Marheinecke; Georg Rehm; Tolga Kayadelen; Mohammed Attia; Ali Elkahky; Zhuoran Yu; Emily Pitler; Saran Lertpradit; Michael Mandl; Jesse Kirchner; Hector Fernandez Alcalde; Jana Strnadová; Esha Banerjee; Ruli Manurung; Antonio Stella; Atsuko Shimada; Sookyoung Kwak; Gustavo Mendonca; Tatiana Lando; Rattima Nitisaroj; Josie Li

    In: Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies. Conference on Computational Natural Language Learning (CoNLL-2017), The SIGNLL Conference on Computational Natural Language Learning, August 3-4, Vancouver, BC, Canada, Pages 1-19, Association for Computational Linguistics, 2017.

Fördergeber

EU - Europäische Union

EU - Europäische Union