Skip to main content Skip to main navigation

Projekt

Pret-a-LLOD

Scalable Open Linked Data environment

Scalable Open Linked Data environment

  • Laufzeit:

Sprachtechnologien sind zunehmend auf große Datenmengen angewiesen, um einen besseren Zugang zu Sprachressourcen zu ermöglichen. Damit koennen mehrsprachige Lösungen angeboten werden, die den digitalen Binnenmarkt in Europa unterstützen würden. Allerdings sind Daten selten "ready-to-use" und Sprachtechnologiespezialisten verbringen über 80% ihrer Zeit mit der Bereinigung, Organisation und Sammlung von Datensätzen. Die Reduzierung dieses Aufwands verspricht enorme Kosteneinsparungen für alle Bereiche, in denen Sprachtechnologien benötigt werden. Ein wesentlicher Bestandteil des Extract-Transform-Load-Prozesses ist die Verknüpfung von Datensätzen mit bestehenden Schemata. Aber nur wenige Spezialisten nutzen die Vorteile verknüpfter Datentechnologien, um diese Aufgabe zu erfüllen. Im Pret-a-LLOD Projekts wollen wir die Verbreitung von Sprachtechnologien steigern, indem wir die Kombination aus verknüpften Daten und Sprachtechnologien, nämlich die "Linguistic Linked Open Data" (LLOD) Wwolke, nutzen, um gebrauchsfertige mehrsprachige Daten zu erstellen. Prêt-à-LLOD will dies erreichen, indem es eine neue Methodik für den Aufbau von Daten-Wertschöpfungsketten schafft, die für ein breites Spektrum von Sektoren und Anwendungen anwendbar ist und auf Sprachressourcen und Sprachtechnologien basiert, die mittels semantischer Technologien integriert werden können, insbesondere die Verwendung von Linguistic Linked Open Data (LLOD). Das Projekt wird neue Werkzeuge für die Transformation und Verknüpfung von Datensätzen entwickeln und diese sowohl auf Daten als auch auf Metadaten anwenden, um einen Multi-Portal-Zugang zu heterogenen Datenspeichern zu ermöglichen. Wir werden untersuchen, wie wir Lizenzen automatisch analysieren können, um daraus abzuleiten, wie Daten von Sprachressourcenanbietern rechtmäßig verwendet und verkauft werden können. Schließlich werden wir Werkzeuge zur Verfügung stellen, um Sprachdienste und -ressourcen durch den Einsatz semantischer Technologien zu komplexen Pipelines zu kombinieren. Dies wird zu nachhaltigen Datenangeboten und -diensten führen, die auf vielen Plattformen, einschließlich bisher unbekannter Plattformen, bereitgestellt und mit verknüpfter Datensemantik selbst beschrieben werden können.

Partner

NATIONAL UNIVERSITY OF IRELAND GALWAY (Coordinator)
Ireland UNIVERSIDAD DE ZARAGOZA -- Spain UNIVERSIDAD POLITECNICA DE MADRID -- Spain UNIVERSITAET BIELEFELD -- Germany JOHANN WOLFGANG GOETHEUNIVERSITATFRANKFURT AM MAIN -- Germany DEUTSCHES FORSCHUNGSZENTRUM FUR KUNSTLICHE INTELLIGENZ GMBH -- Germany SEMALYTIX GMBH -- Germany THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD -- United Kingdom SEMANTIC WEB COMPANY GMBH -- Austria DERILINX LIMITED -- Ireland

Fördergeber

EU - Europäische Union

EU - Europäische Union

Publikationen zum Projekt

Marija Ivanović; Thierry Declerck

In: Catherine Brun; Christophe Roche (Hrsg.). Actes de la conférence TOTh 2021. Terminology & Ontology: Theories and applications (TOTh-2021), June 3-4, Chambéry,, France, Pages 21-38, ISBN 978-2-37741-079-8, Presses Universitaires Savoie Mont Blanc, 73011 CHAMBÉRY CEDEX, 12/2022.

Zur Publikation

Thierry Declerck; Patricia Martín Chozas; Tom Winter; Tanja Wissik

In: Catherine Brun; Christophe Roche (Hrsg.). Actes de la conférence TOTh 2021. Terminology & Ontology: Theories and applications (TOTh), June 3-4, Chambéry,, France, Pages 123-136, Presses Universitaires Savoie Mont Blanc, 73011 CHAMBÉRY CEDEX, 12/2022.

Zur Publikation

Thierry Declerck; Marija Ivanović

In: Catherine Brun; Christophe Roche (Hrsg.). Actes de la conférence TOTh 2021. Terminology & Ontology: Theories and applications (TOTh-2021), June 3-4, Chambéry, France, Pages 137-152, ISBN 978-2-37741-079-8, Presses Universitaires Savoie Mont Blanc, 73011 CHAMBÉRY CEDEX, 12/2022.

Zur Publikation