Ziel ist, ein Informationsextraktionssystem mit höherer Abdeckung und größerer Genauigkeit zu entwickeln als bisher vorhanden. Der zugehörige Forschungsbereich der automatischen Analyse natürlichsprachiger Texte hat klare Anwendungsgebiete im Wirtschaftsbereich, zum Beispiel bei der Überwachung von branchenspezifischen Nachrichtenpublikationen bezüglich neuer Trends oder bei der Verarbeitung von technischen Dokumentationen und Schriftverkehr und deren Anreicherung mit semantischen Informationen. Der Schwerpunkt der Arbeit wird sein, sowohl Abdeckung als auch Genauigkeit des Systems gegenüber dem aktuellen Technikstand zu verbessern. Dazu wird existierendes Domänenwissen ausgenutzt, zum Beispiel in Form von unternehmensinternen Datenbanken oder im Internet frei verfügbaren Datenquellen. Die Daten dienen zuerst zur Generierung einer großen Zahl von Trainingsbeispielen, wodurch das System eine hohe Abdeckung in der Erkennung von Fakten erhält. Später wird ein Mechanismus entwickelt, der aus Texten extrahierte Kandidatenfakten gegen vorhandene Daten abgleicht und auf Konsistenz und Plausibilität prüft.