MEMPHIS definiert, entwickelt und evaluiert ein neues System, welches den Betrieb kommerzieller multilingualer Informationsdienste ermöglicht, die auf tragbare Clients wie Handys, PDAs usw. abzielen. MEMPHIS bezieht multilinguale Inhalte aus diversen Quellen in unterschiedlichen Formaten, z.B. aus dem Internet, basierend auf dynamischen Benutzerprofilen. Die Inhalt werden in eine XML-Meta-Repräsentation transformiert, die das Speichern der Inhalte unabhängig von Quell- und Zielsprache ermöglicht. Die Verarbeitung beinhaltet die Erkennung der Quellsprache und die automatische Übersetzung des Quelldokuments in eine Metasprache. Mittels Informationsextraktion werden komprimierte Dokumente erzeugt, etwa Zusammenfassungen. Bei einer Benutzeranfrage kann eine Übersetzung aus der Metasprache in die Zielsprache angefordert werden. Das Ausgabeformat berücksichtigt die Ausgabeanforderungen und -möglichkeiten des Clientgeräts, z.B. SMS, WAP, WWW, Email usw. Dies involviert eine Konversion in Dokumente unterschiedlicher Länge aus der gleichen Quelle.
Der Forschungsbereich Sprachtechnologie des DFKI ist verantwortlich sowohl für die multilinguale Analyse der Dokumente, d.h. Sprachenidentifikation, Kategorisierung, Extraktion relevanter Information und ihre sprachunabhängige XML-basierte Repräsentation für den sprachübergreifenden Retrieval, als auch für die Generierung von Text/Zusammenfassungen im Hinblick auf Benutzerprofil, Zielsprache und Zielgerät.
- Identifikation der Sprache eines Dokuments multilinguale statistische Kategorisierung von Dokumenten
- Extraktion von Zusammenfassungen, einschließlich Schlüsselwörtern und -phrasen
- Extraktion relevanter Information als relationalen Templates
- sprachunabhängige XML-basierte Repräsentation der extrahierten Information
- flexible multilinguale Generierung von Text aus diesen Repräsentationen