DocuTag - Semantische Dienste für das Tagging von Dokumenten in Unternehmen.
In einer Unternehmung existiert im Allgemeinen eine Vielzahl von Informationssystemen mit unterschiedliche Strukturierungen und Formalisierungen, die vorhandenen Informationen (z.B. Kundendaten) partitionieren und duplizieren. Unglücklicherweise sind diese Systeme auf Grund von Heterogenitäten oft nicht in der Lage sich konsistent untereinander auszutauschen, wodurch Inkonsistenzen und Informationslücken entstehen können. Mitarbeiter werden hierdurch daran gehindert den aktuellen Informationsstand ihrer Unternehmung gesamtheitlich zu erfassen und treffen auf Grund dessen falsche Entscheidungen, basierend auf fehlerhaften oder fehlenden Einordnungen, Assoziationen und Schlussfolgerungen.
In dem Projekt DocuTag soll ein Ansatz geschaffen werden, diese Problematik zu überwinden, indem im ersten Schritt eine einheitliche Einordnung (Ontologie) für eine Unternehmung entworfen wird, um relevante Informationen einheitlich zu verwalten. Eine Auswahl aus bereits existierenden Informationen existierender Quellsysteme werden im zweiten Schritt in dieser Einordnung zusammengeführt. Neue Dokumente (z.B. E-Mail, Aufgaben, Notizen, etc.) können nun im dritten Schritt direkt mit dem aktuellen Informationsstand der Unternehmung, semi-automatisiert in Beziehung gesetzt werden und letztendlich diesen erweitern. Hierbei wird eine "Web 2.0"-Technik genannt "Tagging" adaptiert, die es Benutzen ermöglicht, Dokumente mit bestehenden Dingen (Personen, Orte, Ereignisse, etc.) der Ontologie zu annotieren, oder neue Dinge hinzuzufügen.
In DocuTag sollen neue unternehmungsrelevante Information aus Dokumenten mit Dingen der unternehmensweiten Ontologie verknüpft werden. Dieser Vorgang soll durch generierte, intelligente Vorschläge unterstützt werden (Falls in der Ontologie der Kunde Herr Meier eine Klasse Beschwerdebrief existieren, kann ein Dokument, welches den Namen Herr Meier enthält und als Beschwerdebrief eingeordnet wurde, von DocuTag mit Herrn Meier durch die Beziehung genannt "Beschwerde von" verknüpft werden.).
Folgende Aspekte von DocuTag werden als forschungsrelevant angesehen:
- Extraktion von Themen (Schlagwörtern) aus strukturierten und unstrukturierten Dokumenten,
- Generierung von Vorschlägen für das semantische "Tagging" aktuell vorliegender Dokumente,
- proaktiven Bereitstellung relevanter Dokumente aus verschiedenen Quellen (Desktop, Intranet, World Wide Web),
- Generierung von Vorschlägen für semantische Beziehungen zwischen gefundenen Dokumenten und Themen.