Speech and Language Technology

Das Speech and Language Technology Lab (SLT) des DFKI erforscht den Einsatz von KI zur Analyse, Generierung und Interaktion von gesprochener und geschriebener Sprache. Unser Forschungsschwerpunkt liegt auf der Extraktion von Informationen aus geschriebenem Text und gesprochener Sprache, auf Wissenstechnologien und auf interaktiven Chatbots. Auf dem Gebiet der Informationsextraktion trägt SLT mit relevanten wissenschaftlichen Publikationen in den Bereichen des Trainings auf Grundlage von sparse data (begrenzt verfügbare Daten), durch sequentielles Transferlernen, z. B. von Alt, 2020, oder durch Multitasking-Lernen, z. B. von Mittag, 2021 sowie explainable AI (z. B. von Schwarzenberg, 2021) bei. In dem Bereich Wissensmanagement bietet SLT im Rahmen der skalierbaren Cloud-Plattform ELG und anderen europäischen und nationalen Projekten Zugang zu einer Vielzahl mehrsprachiger Ressourcen, wobei der Schwerpunkt auf Datenkuratierung sowie Techniken zur Verwaltung von Forschungsdaten liegt.  Auf dem Gebiet der Chatbots konzentriert sich das SLT Lab auf das schnelle Bootstrapping von Chatbots aus Wissensgraphen, auch für industrielle Anwendungen, sowie auf die Simulation von menschlichem Interaktionsverhalten. Unsere Kernkompetenzen liegen im Einsatz von Crowdsourcing zur Datengenerierung, in der Entwicklung hybrider Mensch-Maschine-Intelligenz-Prozesse sowie dem Fokus auf Bewertungsmethoden, zu denen SLT durch wissenschaftliche Publikationen und internationale Standards kontinuierlich einen Beitrag leistet. Die Anwendungsfelder unserer Technologien finden sich in den Bereichen Medizin, Mobilität, Recht sowie der maschinellen Übersetzung.

 

Themenfelder

Text Analytics

Das Gebiet der Textanalyse zielt darauf ab, zu verstehen, wie Menschen natürliche Sprache verwenden, um Informationen und Wissen zu übermitteln. Es entwickelt Techniken und Modelle, die es Computerprogrammen ermöglichen, Informationen und Wissen aus unstrukturierten Textdokumenten zu extrahieren, um sie in strukturierter Form für die computergestützte Weiterverarbeitung bereitzustellen Anwendungen. Unsere Arbeit in diesem Bereich konzentriert sich auf Kernforschung zu Domänenanpassung, Lernen in ressourcenarmen Umgebungen, Schlußfolgern über größere Kontexte, kontinuierliches Lernen, und multilinguale Modelle; in Domänen wie Gesundheit/Medizin, Industrie und Mobilität. Dafür kombinieren wir tiefgreifende linguistische Analysen mit modernstem maschinellem Lernen und neuronalen Ansätzen für NLP.

Weitere Informationen

Dialog & Chat

Durch Dialog- und Chattechnologien können Menschen mit Computern in natürlicher Sprache sprechen oder chatten. Zum einen können Computer natürliche Sprache verstehen, zum anderen können sie auch in natürlicher Sprache antworten. Ein Schwerpunkt am Speech and Language Technology Lab im Bereich Dialog und Chat liegt auf modularen Dialogsystemen: Wie kann man Dialogsysteme aufbauen, die aus mehreren Sub-Dialogsystemen zusammengesetzt sind? Diese modularen Dialogsysteme versprechen eine ganze Reihe von Vorteilen: Dialogsysteme können leicht in anderen Kontexten weiterverwendet werden; Sie können aus unterschiedlichen Technologien zusammengesetzt werden; Darüber hinaus verspricht diese modulare Technologie neue Möglichkeiten für Dialogmanagement und Multitasking in Dialogen.

Weitere Informationen

Linguistic Data Science

Die linguistische Datenwissenschaft behandelt die empirischen Aspekte der Linguistik wie beispielsweise Korpusannotationen oder statistische Auswertungen von Sprachdaten mit linguistischen Verfahren. 

Ein wichtiges Thema dieses Forschungsfeldes, mit dem sich dass Speech and Technology Lab beschäftigt, ist die Frage, wie man Textqualität beschreibt.

Weitere Informationen

Language, Data and Knowledge Technologies

Im Themenfeld Language, Data and Knowledge Technologies beschäftigen wir uns mit allen notwendigen Technologiekomponenten, die für die Entwicklung, prototypische Demonstration sowie Nutzbarmachung und Wirkbetrieb von Sprachtechnologien notwendig sind, insbesondere in Bezug auf Anwendungen im professionellen Bereich der Kuratierung digitaler Inhalte (Kuratierungstechnologien). Dabei setzen wir unter anderem regelbasierte, aber auch datengetriebene neuronale sowie wissensbasierte Verfahren ein, die die symbolische und die subsymbolische Ebene miteinander kombinieren und die jeweiligen Vorteile nutzbar machen. Weitere Aspekte des Themenfeldes sind Einsatz und Entwicklung von Sprachtechnologieplattformen, die Einbettung der Forschungsarbeiten in die Entwicklung einer Strategie für technologiegestützte Mehrsprachigkeit in Europa und die Nutzbarmachung von Standardisierungsaktivitäten für das Themengebiet Sprachtechnologie.

Weitere Informationen

Kontakt

Sekretariat:

Tel.: +49 30 23895 0
Fax: +49 30 23895 1810

Deutsches Forschungszentrum für
Künstliche Intelligenz GmbH (DFKI)
Speech and Language Technology Lab
Alt-Moabit 91c
10559 Berlin
Deutschland

News aus dem Forschungsbereich

Nach zwei Jahren mit virtuellen Veranstaltungen kehrt die europäische Konferenz für Sprachtechnologien nach Brüssel zurück: META-FORUM 2022 findet am…

zum Artikel

Die dritte Ausgabe der QURATOR-Konferenz für KI-getriebene Kuratierungstechnologien in Kultur, Medien, Industrie und Medizin findet vom 19. bis 23.…

zum Artikel
Rise of AI- Konferenz - Logo

Prof. Dr. Hans Uskzoreit, wissenschaftlicher Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) und führender Experte im…

zum Artikel

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence