Projekt | IMPRESS

Laufzeit: 01.08.2020 - 31.01.2024

Verbesserte Wort- und Satzeinbettung mithilfe semantischen Wissens

Forschungsthemen

Anwendungsfelder

Sonstige

Die meisten sprachverarbeitenden Systeme verwenden heutzutage Vektordarstellungen von Wörtern und Sätzen, sogenannte Wort- und Satzeinbettungen. Das Ziel hierbei ist eine abstrakte Darstellung der Semantik bei gleichzeitiger Dimensionsreduktion zu erhalten. Bei der Verarbeitung von Sprache in Kombination mit Sehen oder anderen sensorischen Modalitäten werden in ähnlicher Weise multimodale Einbettungen verwendet. Zwar verkörpern Einbettungen eine Form semantischer Verwandtschaft, doch deren Natur wird nicht expliziert. Das Fehlen präziser semantischer Deutlichkeit kann sich negativ auf nachgelagerte Verarbeitung auswirken.

IMPRESS untersucht die Integration von semantischem Wissen in sprachliche und multimodale Einbettungen und die erwarteten Verbesserungen für ausgewählte nachgelagerte Sprachverarbeitung. IMPRESS entwickelt Open-Source-Software und lexikalische Ressourcen, wobei der Schwerpunkt auf Videoaktivitätserkennung als praktische Anwendung liegt. Die meisten Forschungsarbeiten zu multimodalen Einbettungen verwenden Englisch als sprachliche Modalität. IMPRESS wird zusätzlich Französisch und Deutsch aufnehmen.

Partner

DFKI 2. INRIA

Kontakt

Dipl.-Inf. Bernd Kiefer

Bernd.Kiefer@dfki.de
Tel.: +49 681 85775 5332

Keyfacts

Publikationen

Alle Publikationen

Multilingual coreference resolution: Adapt and Generate
Tatiana Anikina; Natalia Skachkova; Anna Mokhova
In: Zdeněk ´abokrtský; Maciej Ogrodniczuk (Hrsg.). Proceedings of the CRAC 2023 Shared Task on Multilingual Coreference Resolution. Workshop on Computational Models of Reference, Anaphora and Coreference (CRAC-2023), located at EMNLP 2023, December 6-7, Singapore, Singapore, Pages 19-33, Association for Computational Linguistics, 12/2023.
AutoQIR: Auto-Encoding Questions with Retrieval Augmented Decoding for Unsupervised Passage Retrieval and Zero-shot Question Generation
Stalin Varanasi; Muhammad Umer Butt; Günter Neumann
In: Large Language Models for Natural Language Processing. International Conference on Recent Advances in Natural Language Processing (RANLP-2023), located at RANLP, September 4-6, Varna, Bulgaria, Pages 1171-1179, ISBN ISBN 978-954-452-092-2, INCOMA Ltd. Shoumen, BULGARIA, 9/2023.
Find-2-Find: Multitask Learning for Anaphora Resolution and Object Localization
Cennet Oguz; Pascal Denis; Emmanuel Vincent; Simon Ostermann; Josef van Genabith
In: Houda Bouamor; Juan Pino; Kalika Bali (Hrsg.). Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing. Conference on Empirical Methods in Natural Language Processing (EMNLP), Singapore, Pages 8099-8110, Association for Computational Linguistics, 2023.

Projekt | IMPRESS

Verbesserte Wort- und Satzeinbettung mithilfe semantischen Wissens

Forschungsthemen

Anwendungsfelder

Partner

Kontakt

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Webseite

Publikationen

Multilingual coreference resolution: Adapt and Generate

AutoQIR: Auto-Encoding Questions with Retrieval Augmented Decoding for Unsupervised Passage Retrieval and Zero-shot Question Generation

Find-2-Find: Multitask Learning for Anaphora Resolution and Object Localization

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung

01IS20076

Forschungsthemen

Anwendungsfelder

Partner

Projekt teilen auf:

Kontakt

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Webseite

Multilingual coreference resolution: Adapt and Generate

AutoQIR: Auto-Encoding Questions with Retrieval Augmented Decoding for Unsupervised Passage Retrieval and Zero-shot Question Generation

Find-2-Find: Multitask Learning for Anaphora Resolution and Object Localization

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung

01IS20076