Skip to main content Skip to main navigation

Verbmobil – vom Maschinellen Dolmetscher zur iPhone App

| Pressemitteilung | Saarbrücken

Mit dem Verbmobil-Forschungsprototypen konnte im Jahr 2000 eine Blaupause für die multilingualen Kommunikationssysteme der Zukunft vorgelegt werden. Nach Abschluss des Verbundvorhabens wurden Module von Industriepartnern oder Spin-off-Unternehmen intensiv weiter entwickelt. Bei den Voice Awards wurden in den letzten 6 Jahren insgesamt ca. 200 Systeme eingereicht und evaluiert, die auf Verbmobil-Ergebnissen aufbauen. Mittlerweile findet sich Verbmobil-Know how z.B. in iPhone Apps wie Jibbigo oder i-You.

10 Jahre nach Projektende wurden Mitte November am DFKI in Saarbrücken die Ergebnisse und Perspektiven eingeordnet, die persönlichen Entwicklungen und beruflichen Erfahrungen, die Produktisierungen, die wirtschaftlichen und wissenschaftlichen Impulse. Und es gab eine Weltpremiere: Yocoy Technologies GmbH präsentierte das erste Mal die neue App yochina, ein intelligenter Reise-, Sprach- und Kulturführer für Chinareisende. Sprachtechnologie macht Computer zu Wissensassistenten und hat den Massenmarkt erreicht. "Die Verbmobil-Ergebnisse bilden für uns noch heute eine Grundlage für sprachtechnologische Produktinnovationen. Nuance ist der weltweit größte Anbieter von Lösungen im Bereich Sprachtechnologie", Stephan Kanthak, Gruppenleiter Nuance Automotive R&D und ehemaliger Modulkoordinator für Spracherkennung in Verbmobil.

„Verbmobil: Multilinguale Verarbeitung von Spontansprache“ war weltweit das größte und erfolgreichste Leitprojekt seiner Art mit Partnern aus Deutschland, Japan und den USA (Laufzeit 1993-2000), gefördert vom Bundesministerium für Bildung und Forschung, BMBF, Projektträger DLR. Das Ziel: ein mobiler maschineller Dolmetscher, der in Terminverhandlungs- und Reisesituationen gesprochene Eingaben übersetzt. Mit dem Verbmobil-Forschungsprototypen wurde dieses Ziel für eingeschränkte Domänen erreicht. In einigen Aspekten wird die Leistungsfähigkeit dieses Systems auch heute noch von keinem System übertroffen. Verbmobil ist heute als einziges Softwaresystem ein Exponat in der „Hall of Fame“ des Deutschen Museums in München als Dauerausstellung zu neuen Technologien.

Knapp 100 Teilnehmer diskutierten vom 15.-16.11. am DFKI in Saarbrücken intensiv über die wissenschaftlichen und wirtschaftlichen Ausblicke für Sprachtechnologieprojekte und -produkte: Aktuelle Forschungsvorhaben arbeiten daran, einer Gruppe von Personen zu lauschen, zu wissen, wer, wann und wo, mit wem worüber spricht. Anhand von Bildern und Äußerungen der Teilnehmer sollen automatisch Zusammenfassungen von Besprechungen, Meetings oder Konferenzen erstellt werden. Aktuelle Trends gehen zu multimodalen Dialogen, multilingualen Systemen und Mehrpersonenkommunikation. Anstelle stationärer Rechner, an deren Dialogverhalten sich der Mensch anpassen muss, werden eingebettete, in die Umgebung integrierte oder mobile Systeme Spontansprache verstehen und in der Lage sein, mehrere Sprecher zu unterscheiden. Die Integration der menschlichen Kommunikationsmodi Sprache, Gestik, Mimik, Blicksteuerung und physische Aktion beschreitet den Weg vom maschinellen Dolmetscher zur multimodalen Antwort-Maschine und zur anthropomorphen Mensch-Umgebungs-Kommunikation. Verbmobil bildet das technologische Fundament dazu.

Der Projektfortschritt wurde in den 90gern von einem internationalen Gutachtergremium begleitet, beraten, kontrolliert: „Verbmobil war ein in vielerlei Hinsicht bemerkenswertes Projekt“, so der vom BMBF bestellte Verbmobil-Gutachter Prof. Stephan Euler. „Zunächst war es ein großes Projekt – viele Partner und eine lange Laufzeit. Weiterhin waren die Ziele ausgesprochen ambitioniert. Die Übersetzung spontansprachlicher Eingaben unter Berücksichtigung des Dialogkontextes  beinhaltet angefangen von der Spracherkennung bis hin zur Sprachsynthese für die Ausgabe eine ganze Reihe schwierigster Teilprobleme. Schließlich stellten auch die Integration der einzelnen Komponenten zu einem funktionalen Prototyp und die gesamtheitliche Evaluation große Herausforderungen dar. Im Rahmen von Verbmobil wurden Ansätze aus unterschiedlichen Disziplinen zusammengeführt. Die interdisziplinäre Zusammenarbeit führt zu fruchtbaren Diskussionen und einem vielfältigen Austausch. So war die neuartige Kombination von stochastischen mit wissensbasierten Verfahren ein wesentlicher Schritt für die robuste Funktionsweise des Prototypen. In Verbmobil entstanden eine Reihe von Standards sowie Datensammlungen, die weit über das Projekt hinaus genutzt wurden. In vielen Bereichen – genannt seien beispielhaft die Erkennung prosodischer Merkmale und die Kombination stochastischer und wissensbasierter Verfahren zur automatischen Übersetzung – wurden Grundlagen für bis heute andauernden Forschungsarbeiten gelegt. Die Ergebnisse aus Verbmobil wurden von den Industriepartner und diversen Ausgründungen umgesetzt. Eine Vielzahl von Publikationen entstand, wobei das Verbmobil-Buch mit dem abschließenden Überblick ein bis heute aktuelles Standardwerk im Bereich Sprachverarbeitung geblieben ist. Schließlich war Verbmobil prägend für eine ganze Generation Forscher im Bereich Sprachverarbeitung. Eine kaum überschaubare Anzahl von Abschlussarbeiten und Promotionen entstanden direkt oder indirekt aus dem Projekt. Auch 10 Jahre nach Ablauf des Projektes bleibt die gemeinsame Arbeit in Verbmobil für alle Beteiligten eine verbindende Erfahrung“, so Prof. Euler.


Die Verbmobil-Konferenz, 15.-16.11., war voller inhaltsreicher Rückblicke und vielversprechender Ausblicke. Multilinguale Verarbeitung von Spontansprache ist nach wie vor eine wissenschaftliche Herausforderung, ein kulturelles Bedürfnis und ein zunehmend wichtiger wirtschaftlicher und industrieller Geschäftsbereich. „Verbmobil war ein entscheidender Meilenstein auf dem Weg zu domänen-adaptiver maschineller Übersetzung, die in realen Anwendungen einsetzbar ist“, erklärte Verbmobil-Forscher Dr. Andreas Eisele, jetzt Projektmanager Maschinelle Übersetzung, Generaldirektion der Europäischen Kommission: „Das Projekt ermöglichte unter anderem den Zugang zu den von IBM entwickelten statistischen Verfahren, deren Einbindung in eine hybride Architektur sowie deren Weiterentwicklung als quelloffene Software. Damit wurden wesentliche Voraussetzungen für die beeindruckenden Fortschritte in diesem Gebiet seit 2000 geschaffen. Der Einsatz hybrider MÜ-Technologie in der Generaldirektion Übersetzung der Europäischen Kommission wäre ohne die Vorarbeiten durch Verbmobil nicht denkbar.“

Das Verbmobil-System konnte spontan gesprochene Sätze erkennen, die Aussage verstehen, übersetzte sie in eine Fremdsprache und sprach das Ergebnis mit einer künstlichen Stimme aus. Verbmobil arbeitete unimodal allein mit gesprochener Sprache, bewältigte singuläre Dialogaufgaben, kommunizierte sprecherunabhängig mit einem menschlichen Gesprächspartner – und hat den Machbarkeitsbeweis für die gesamte Kette der Sprachverarbeitung erbracht. Dokumentiert wurde das System in einem Buch -„Verbmobil: Foundations of Speech-to-Speech Translation“ - , das sich seit der Erscheinung 2000 im Springer Verlag zum Klassiker der Dialogübersetzung entwickelt hat. Nachdem die Auflage vergriffen war, wurde es nun aktuell als Softcover-Version wieder aufgelegt.

Hunderte Wissenschaftler arbeiteten an den Verbmobil-Meilensteinen und Systemintegrationen. Die Forschungs- und Entwicklungsergebnisse wurden während der Projektlaufzeit auf den großen Industriemessen und den wichtigsten wissenschaftlichen Konferenzen vorgestellt. Verbmobil endete als Projekt mit der Präsentation und der erfolgreichen Evaluierung des Forschungsprototypen auf dem Verbmobil-Symposium, 30. Juli 2000, in Saarbrücken. Seitdem ist wissenschaftlich und technologisch viel passiert, und an vielen Stellen waren Verbmobil-Mitarbeiter intensiv beteiligt. Wissenschaftliche Durchbruchinnovationen des Leitvorhabens waren u.a. die Nutzung der Intonation, der Satzmelodie zum Verständnis des Inhalts, die Verzahnung flacher und tiefer Analysekomponenten in einer Multi-Blackboard Architektur, die Verzahnung statistischer und linguistischer Analysestränge bei der Integration von Dialogakten/Dialogphasen in die tiefe Semantik, die Kombination von Segmentübersetzungen aus verschiedenen Übersetzungssträngen. Mit diesen Technologien wurde es möglich, dass die Übersetzung eines Satzes sich aus den besten Teilübersetzungen unterschiedlicher Module errechnen lässt.

"10 Jahre Verbmobil - Rückblick und Ausblick - Multilinguale Verarbeitung von Spontansprache", 15.11.-16.11.2010, DFKI Saarbrücken.

Kontakt

Reinhard Karger, M.A.
Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI) GmbH
Campus, Geb. D 3 2, D-66123 Saarbrücken
Tel.: +49 681 85775 5253,
Fax: +49 681 85775 5485
Mobil: +49 151 15674571
E-Mail: verbmbobil@dfki.de

Kontakt

Reinhard Karger M.A.
Unternehmenssprecher DFKI

Tel.: +49 681 85775 5253


Deutsches Forschungszentrum für Künstliche Intelligenz GmbH (DFKI)
Saarland Informatics Campus
Stuhlsatzenhausweg 3
66123 Saarbrücken
Deutschland