Flag ist ein Forschungsprojekt, das einen Anwendungsprototypen zur Überprüfung von Grammatik und kontrollierten Sprachen mittels modernster Sprachverarbeitungstechnologien entwickelt. Flag kombiniert flache Verarbeitungsmethoden - statistische Tagger und partielle Parser - mit tiefen, regelbasierten Analysen, um damit die Information herauszufiltern, die für die zuverlässige Identifikation von verschiedenen Fehlertypen und deren anschliessende Korrektur (durch den Benutzer) notwendig ist.
Eine der wichtigsten Voraussetzungen für die Entwicklung von Forschungsprototypen ist eine "Open System Architektur", da sie die Integration diverser Technologien ermöglicht. Dies wird erreicht (i) durch die Integration neuer und bereits bestehender Sprachverarbeitungswerkzeuge in eine Pipeline-Architektur, die sich auf die neuesten Software Engineering Technologien stützt und (ii) durch die Berücksichtigung neuentwickelter Sprachverarbeitungsstandards wie z.B die Text Encoding Initiative und die GATE Engineering Platform. Verschiedene Anwendungsprototypen werden auf ihren möglichen Einsatz hin untersucht, unter anderem der Einsatz von Werkzeugen zur Überprüfung von Grammatik und kontrollierter Sprache als Hilfe für die Prä- und Posteditierung bei Maschineller Übersetzung.
Zusätzlich werden im Rahmen dieses Projekts umfangreiche linguistische Ressourcen erstellt, die die Entwicklung und die Evaluierung von Komponenten zur Überprüfung von Grammatik und kontrollierter Sprache unterstützen. Korpora werden mit Hilfe von in Saarbrücken entwickelten Werkzeugen semi-automatisch annotiert.
- Forschungsziel ist die Entwicklung angemessener Technologien für spezifische Sprachverarbeitungsaufgaben
- Modulare Systemarchitektur basiert auf flacher und tiefer Verarbeitung
- Daten-orientierte Fehlermodelle unterstützen die Forschung