In dem Projekt HyLaP werden hybride sprach- und informationsverarbeitende Methoden verbessert, adaptiert und in einer neuartigen personalisierten Informationszugriffs- und Managementanwendung eingesetzt. Diese Anwendung erlaubt einen integrierten Zugang zu Informationen im persönlichen digitalen Speicher des Benutzers und zu Informationen aus dem globalen Speicher des WWW. Wir nehmen an, dass die natürliche Sprache auch zukünftig das primäre Medium für die Speicherung und den Transfer von komplexer Information, insbesondere des humanen Wissens, darstellen wird. Daher sind natürlichsprachliche Algorithmen eine Schlüsseltechnologie zur Auswertung der vielfältigen Information in der täglichen Arbeit.
Die resultierenden Technologien kombinieren domänenoffene und -geschlossene Fragebeantwortung, Erkennung von Eigennamen, Extraktion von Relationen, automatisches Hyperlinking und die Konstruktion von Ontologien. Daher werden die geplanten Forschungen die am DFKI LT-lab erfolgreich etablierten Forschungsergebnisse in den Bereichen Fragebeantwortung (QA), Informationsextraktion (IE), natürlichsprachlich unterstütztes Informationsretrieval und die ontologiebasierte Wissensextraktion aus Texten aufnehmen und weiterführen. Dies beinhält auch die aktive Teilnahme an internationalen Wissenschaftswettbewerben, wie z.B. der CLEF, als auch die Weiterführung unserer Forschungsaktivitäten im Bereich der effektiven und effizienten Architekturen für die hybride Sprachverarbeitung.
Zur Realisierung eines strukturierten, assoziativen und personalisierten digitalen Speichers auf Basis einer realistischen großen Dokumentenmenge werden kombinierte flache und tiefe Verfahren der Sprachtechnologie exploriert. Die Dokumentenmenge bestehend aus unstrukturierten und strukturierten Daten spiegelt dabei den digitalen Informationsraum eines individuellen Benutzers wider.
Ziel ist es, den Vorteil solch eines strukturellen Speichers im Zusammenhang mit verbesserten IE und QA Methoden zu zeigen und zwar in einer Anwendung, die einerseits eine intuitive und mächtige assoziative Schnittstelle zwischen den Gedanken eines Benutzers und seiner täglichen Arbeit modelliert und anderseits eine assoziative Schnittstelle bereitstellt, die relevante Informationen aus dem persönlichen Speicher und Informationen aus dem Internet in Beziehung setzt.
Das Projekt hat drei Hauptkomponenten:
- Domänenoffene Fragebeantwortung (ODQA)
- Personalisierter, digitaler, assoziativer Speicher (PDAM)
- Assoziative Informationszugriffs- und Managementanwendung (AIAMA)
welche in zwei Teilprojekten bearbeitet werden:
- HyLaP-QA für die Forschung im Bereich der domänenoffenen Fragebeantwortung
- HyLaP-AM für die Forschung im Bereich des personalisierten, digitalen, assoziativen Speichers und der Realisierung der Anwendung.
HyLaP wird unter dem Vertragskennzeichen 01 IW F02 gefördert.