Das World Wide Web (WWW) hat den weltweiten Zugang zu digital gespeicherter Information drastisch vereinfacht und beschleunigt. Allerdings gibt es bisher zwei Zugangshürden:
- Der Zugang zu den Inhalten ist größtenteils auf PCs mit großen Bildschirmen optimiert. Statt eines einfachen, intuitiven Zugangs mittels natürlicher Sprache über das ubiquitäre Mobiltelefon suchen derzeit Suchmaschinen textuell nach Inhalten, die nicht in jeder Modalität, z.B. nur mittels Sprache, dem Benutzer zugänglich gemacht werden können.
- Bislang waren die Inhalte im WWW nur maschinenlesbar, ohne maschinell verstehbar zu sein. Da Information im WWW meist in natürlicher Sprache präsentiert wird, sind die bei einer Suche gefundenen Dokumente bislang nur für den Menschen voll verständlich. Zudem entsprechen die Resultate trotz verbesserter Such- und Rankingtechniken oftmals nicht den Intentionen der Benutzer.
In SmartWeb werden die führenden Forscher aus dem Bereich der Intelligenten Benutzerschnittstellen, des SemanticWeb und der Informationsextraktion Methoden und Technologien erforschen und umsetzen, um diese Hürden zu beseitigen. Das Semantische Web basiert auf der inhaltlichen Beschreibung digitaler Dokumente mit standardisierten Vokabularien, die eine maschinell verstehbare Semantik haben. Damit wird der Übergang von einem "Netz aus Verweisstrukturen" zu einem "Netz aus Inhaltsstrukturen" vollzogen. Dies eröffnet völlig neue Dimensionen in den Bereichen Internetdienste, Information Retrieval, Mobile Computing, E-Commerce und E-Work.
SmartWeb bildet eine wichtige Stufe bei der Realisierung des Internets der nächsten Generation, das breitbandige Multimediadienste mobil und individualisiert bereitstellen wird. SmartWeb ist auf der Ebene der Softwaresysteme angesiedelt, welche die Infrastuktur für spezielle Anwendungsprojekte zur Implementierung neuartiger Mehrwertdienste im Internet der nächsten Generation bildet. SmartWeb ist abgestimmt auf die Entwicklungen auf dem Gebiet des Mobilen Internet und der darunter liegenden Schicht der Hochleistungsfestnetze, welche die Mobilfunkstationen breitbandig mit Datenströmen versorgen. Damit nimmt SmartWeb eine zentrale Stellung bei der Verbindung innovativer Kommunikationstechnologien mit völlig neuartigen Anwendungsfeldern. SmartWeb baut auf die Konvergenz der verschiedenen Mobilfunktechnologien auf und sichert eine bedarfgerechte Informationsversorgung sowie nutzer-zentrierte Informationslogistik.
Neuartige Dienste werden entstehen und durch den weiteren Umbau zur vernetzten Gesellschaft neue, hochwertige Arbeitsplätze schaffen. Dies kann jedoch nur erreicht werden, wenn die Entwicklung innovativer Technologien mit ihrer Akzeptanz beim Nutzer in Beruf und Freizeit einhergeht. Grundvoraussetzung ist hier der intuitive Zugang zum Semantischen Web und seinem Diensten durch intelligente Benutzerschnittstellen in einem mobilen multimodalen Dialog. Während der Zugriff auf das Semantische Web dabei endgeräteunabhängig ist und somit die freie Wahl zwischen PDA, Smartphone, oder auch im Kfz oder auf dem Motorrad lässt, ist das semantische Web eine wichtige Voraussetzung für das mobile Internet und die Präsentation von Information auf unterschiedlichsten Plattformen. Durch die technische Entwicklung auf dem Gebiet der Endgeräte wird ein mobiler breitbandiger Zugang z.B. mittels UMTS an jedem Ort zu jeder Zeit möglich sein. Dies ermöglicht es auch, Informationen zwischen den Geräten und deren Anwendern auszutauschen.
Durch das für SmartWeb festgelegte Demonstratorszenario Fußballweltmeisterschaft 2006 wird dieses Mediengroßereignis gleichzeitig zur Plattform für die weltweite Demonstration von Hochtechnologien aus dem IT-Bereich, die den Innovationsstandort Deutschland und die Marke "Made in Germany" in neuem Glanz erscheinen lassen.
Ziele und Visionen
Das Internet als Quelle für Informationen, Daten und Dienste nimmt einen immer wichtigeren Raum in der heutigen Wissensgesellschaft ein. Die quasi allgegenwärtige Verfügbarkeit jedweder Information wird allerdings beeinträchtigt durch die Schwierigkeit, eine bestimmte Information im Ozean der Daten zu finden. Das Web als derzeit noch weitgehend unstrukturiertes Netz von unspezifizierten Verbindungen zwischen einzelnen Webseiten, die bestimmten formalen Kriterien genügen (man spricht vom Syntaktischen Web), entwickelt sich deshalb mehr und mehr zu einem Netz von Inhalten, in denen Webseiten über semantische Beziehungen untereinander verknüpft sind, dem Semantischen Netz. Damit werden Webseiten, die heute in der Regel nur für den Menschen inhaltlich analysierbar sind, auch für Softwaresysteme inhaltlich analysierbar.
Im Rahmen des Übergangs vom Syntaktischen zum Semantischen Web stellen sich drei zentrale Herausforderungen, die in der hier skizzierten Leitinnovation SmartWeb integriert angegangen werden sollen:
- Die Generierung und Analyse semantisch annotierter Webseiten.
- Ein ubiquitärer und intuitiver Zugang zum Semantische Netz für den Nutzer.
- Fragebeantwortung im offenen Themenbereich (Domäne).
Mit dem mobilen, intuitiven Zugriff auf das Semantische Web steht die geplante Leitinnovation SmartWeb für die Integration der Ansätze des Leitprojektes in der Mensch-Technik-Interaktion SmartKom (insbesondere SmartKom-Mobile) und der Expertise des Kompetenzzentrums Semantisches Web.
Die Benutzer müssen auch komplexe Anfragen intuitiv stellen und multimediale Suchergebnisse intuitiv erfassen können. Hierfür ist eine multimodale Benutzerschnittstelle erforderlich. Auf der Ein- und Ausgabeseite werden alle definierten Modalitäten adressiert. SmartWeb beherrscht den Übergang zwischen ressourcenschonender lokaler Verarbeitung auf dem mobilen Endgerät und aufwendiger Verarbeitung auf einem Backend-Server. Es wird zudem zwischen zwei Arten von Dialogen unterschieden: Bedien- und Suchdialog. Im Bediendialog kann der Benutzer das System über die lokal auf dem Endgerät verfügbaren Komponenten ansprechen.
Für den SmartWeb-Ansatz des ubiquitären, intuitiven Zugriffs auf Webinhalte im allgemeinen ist eine jederzeit dem aktuellen State of the Art angepasste Hard- und Softwareausstattung unerlässlich, um mit der immer schneller voranschreitenden Entwicklung gerade im Bereich des WWW, seines Inhaltes, der angebotenen Dienste und der entsprechenden Endgeräte mitzuhalten. Daraus ergibt sich zwangsläufig die Notwendigkeit der strikten Modularisierung aller Systemfunktionalitäten und der Berücksichtigung von existierenden Standards sowie der Mitgestaltung von neuen Standards insbesondere für die Schnittstellendefinitionen zu externen Geräten, falls diese - was zu erwarten ist - während der gesamten Laufzeit des Projektes aufgrund des auch hier erfolgenden technologischen Fortschritts erneuert werden müssen.
Die Technologie
Den Kern der Technologie des Semantischen Web bilden Markierungssprachen, die eine formale Syntax und Semantik haben und in Form einer Ontologie eine standardisierte Begrifflichkeit zur Beschreibung digitaler Inhalte bereitstellen.
Semantische Markierungssprachen wie OWL erlauben die weltweite Verbreitung und gemeinsame Nutzung von Ontologien im WWW. Die semantische Markierung durch Metadaten stellt neben der Markierung für das Layout (HTML) und die Struktur (XML) eines Dokuments die dritte Ebene einer Dokumentbeschreibung dar. Bei der Suche nach Information können Schlussfolgerungen den Suchprozess beschleunigen oder gesuchte Information ableiten. Methoden des maschinellen Lernens, des Data Mining und des Text Mining reduzieren beim Aufbau und bei der Wartung von Ontologien den manuellen Aufwand. Software-Werkzeuge unterstützen das Erstellen, Editieren, Visualisieren, Auswerten, Verschmelzen und Validieren von Ontologien.
Multimediale Daten bilden einen wesentlichen Bestandteil des zukünftigen Semantischen Web. Die Moving Pictures Expert Group (MPEG) entwickelt bspw. MPEG-7 als Standard zur Metadatenbeschreibung multimedialer Inhalte, namentlich Still Pictures, Graphics, 3D Models, Audio, Speech, Video und deren Kombinationen (z.B. Multimedia Presentations). MPEG-7 Deskriptoren und Schema werden in XML Schema definiert. Die Semantik von MPEG-7 kann in RDF-Schemata spezifiziert werden.
Problem und Lösung
Der Gefahr der Informationsüberflutung kann durch das semantische Web begegnet werden. Information wird in Zukunft dem Nutzer bedarfs- und situationsgerecht sowie personalisiert zur Verfügung gestellt. Durch die Verwendung von Ontologien können Hyperlinks inhaltlich klassifiziert werden, so dass ein semantisch-gesteuertes Surfen und ein Retrieval mit inhaltlichen Ähnlichkeitsmetriken möglich wird. Durch Zugriff auf semantische Webseiten können intelligente Suchagenten mit hoher Präzision gezielt Information im Internet auffinden, filtern und kombinieren, um dem Benutzer zeitaufwendige Recherchearbeit abzunehmen. Die Relevanz
Informationstechnische Dienste werden durch eine ontologische Beschreibung ihrer Voraussetzungen, Funktionalitäten und Schnittstellen zu semantischen Webdiensten, die durch Agentensysteme automatisch auffindbar, ausführbar und konfigurierbar werden. Über eine gemeinsame Semantik, die mit Hilfe einer Ontologiesprache eingeführt wird, können heterogen gespeicherte Daten in einem gemeinsamen Datenmodell zusammengeführt, inhaltlich selektiert und für unterschiedliche Präsentationsformen aufbereitet werden.
Die Prognose
Das semantische Web wird in der nächsten Dekade schrittweise das bestehende WWW ablösen und für den Benutzer stark vereinfachte Dienste im Bereich der Informationssuche, des E-Business, des E-Government, des E-Recruiting und des Wissensmanagements anbieten. Branchen-Ontologien werden künftig die wesentlichen Begriffe und Beziehungen für eine bestimmte Branche definieren, so dass eine Interoperabilität von Webdiensten erreicht wird. Metadaten werden die Transformation digitaler Inhalte für unterschiedliche Ausgabegeräte und Nutzergruppen unterstützen.
Partner
- DFKI GmbH (Konsortialleitung)
- BMW Forschung und Technik GmbH
- DaimlerChrysler AG
- Deutsche Telekom AG, T-Systems Nova GmbH
- European Media Laboratory GmbH
- FhG-FIRST
- Friedrich-Alexander-Universität Erlangen-Nürnberg
- International Computer Science Institute
- Ludwig-Maximilians-Universität München
- Ontoprise GmbH
- Siemens AG
- Sympalog Voice Solutions GmbH
- Universität des Saarlandes
- Universität Karlsruhe (TH)
- Universität Stuttgart