Monnet (Multilingual ONtologies for NETworked knowledge) ist ein EU-finanziertes Projekt in der Sparte Sprachtechnologie im ICT- Bereichs des 7. Rahmenprogramms. Das Projekt hat im März 2010 die Arbeit aufgenommen.
Monnet wird technologische Lösungen anbieten, die den mehrsprachigen Zugang zu Online-Information ermöglicht. Der erste Schritt für Monnet besteht in der Errichtung einer Infrastruktur für Extraktion, Repräsentation und Zugang zum Wissen, das in multilingualen Dokumenten verfügbar ist. Dafür wird eine neuartige Kombination von Semantic-Web-Technologien und maschineller Übersetzung implementiert
Aktuelle Ansätze zum cross-lingualen Zugang zu Information bieten nur Teillösungen, die das Problems in einer eingeschränkten Weise behandeln, in dem sie auf der Ebene des Dokuments bleiben, ohne einen einheitlichen Ansatz zu Extraktion, Repräsentation, Integration und Abfrage von Informationen zu betrachten, die in verschiedenen Sprachen und heterogenen Datenquellen (freier Text, semi- strukturiert, strukturiert) verfügbar sind. Daher ist der Stand der Technik in der maschinellen Übersetzung noch unzureichend für die Bereitstellung von mehrsprachigen Dienstleistungen in bestimmten Bereichen.
Ein zentraler Aspekt der Lösung von Monnet liegt in der Tatsache, dass die eingesetzten Technologien Information auf einer semantischen Ebene verarbeiten und so über die jeweilige Sprache und Form der Dokumente abstrahieren, so dass ein einheitlicher Zyklus von Informationsverarbeitung (Extraktion und Integration) und Präsentation von mehrsprachigen Informationen ermöglicht wird. Zu diesem Zweck arbeitet Monnet an drei Komponenten, die alle auf einer neuartigen Repräsentation von linguistischem Wissen in Domänen-Ontologien beruhen:
- Mehrsprachige Ontologielokalisierung, die die existierenden Ontologien semi-automatisch in mehrere Sprachen übersetzt. Damit wird die cross-linguale ontologiebasierte Informationsextraktion unterstützt.
- Cross-linguale ontologiebasierte Informationsextraktion. Normiert und speichert die extrahierte Inforrmation aus Dokumenten in verschiedenen Sprachen in einem sprachunabhängigen Wissensrepräsentationssystem.
- Cross-lingualer Zugang zum gespeicherten Wissen und dessen Präasentation in der Sprache des Benutzers
Der Ansatz zur Unterstützung des mehrsprachigen Internets wird im Rahmen von zwei Anwendungsfällen im Bereich des e-Governments und im Bereich der Finanz-und Wirtschaftsinformation validiert.
Partner
- National University of Ireland Galway , Irland
- DFKI , Deutschland
- Universität Bielefeld , Deutschland
- Universidad Politénica de Madrid , Spanien
- SAP , Deutschland
- XBRL Europe , Belgien
- Be Informed , Niederlanden