Speech and Language Technology

Das Speech and Language Technology Lab (SLT) des DFKI erforscht den Einsatz von KI zur Analyse, Generierung und Interaktion von gesprochener und geschriebener Sprache. Unser Forschungsschwerpunkt liegt auf der Extraktion von Informationen aus geschriebenem Text und gesprochener Sprache, auf Wissenstechnologien und auf interaktiven Chatbots.

Auf dem Gebiet der Informationsextraktion trägt SLT mit relevanten wissenschaftlichen Publikationen in den Bereichen des Trainings auf Grundlage von sparse data (begrenzt verfügbare Daten), durch sequentielles Transferlernen (z. B. von Alt, 2020) oder durch Multitasking-Lernen (z. B. von Mittag, 2021) sowie explainable AI (z. B. von Schwarzenberg, 2021) bei. In dem Bereich Wissensmanagement bietet SLT im Rahmen der skalierbaren Cloud-Plattform ELG und anderen europäischen und nationalen Projekten Zugang zu einer Vielzahl mehrsprachiger Ressourcen, wobei der Schwerpunkt auf Datenkuratierung sowie Techniken zur Verwaltung von Forschungsdaten liegt.

Auf dem Gebiet der Chatbots konzentriert sich das SLT Lab auf das schnelle Bootstrapping von Chatbots aus Wissensgraphen, auch für industrielle Anwendungen, sowie auf die Simulation von menschlichem Interaktionsverhalten. Unsere Kernkompetenzen liegen im Einsatz von Crowdsourcing zur Datengenerierung, in der Entwicklung hybrider Mensch-Maschine-Intelligenz-Prozesse sowie dem Fokus auf Bewertungsmethoden, zu denen SLT durch wissenschaftliche Publikationen und internationale Standards kontinuierlich einen Beitrag leistet. Die Anwendungsfelder unserer Technologien finden sich in den Bereichen Medizin, Mobilität, Recht sowie der maschinellen Übersetzung.

Themenfelder:

Text Analytics

Das Gebiet der Textanalyse zielt darauf ab, zu verstehen, wie Menschen natürliche Sprache verwenden, um Informationen und Wissen zu übermitteln. Es entwickelt Techniken und Modelle, die es Computerprogrammen ermöglichen, Informationen und Wissen aus unstrukturierten Textdokumenten zu extrahieren, um sie in strukturierter Form für die computergestützte Weiterverarbeitung bereitzustellen. Unsere Arbeit in diesem Bereich konzentriert sich auf Kernforschung zu Domänenanpassung, Lernen in ressourcenarmen Umgebungen, Schlußfolgern über größere Kontexte, kontinuierliches Lernen, und multilinguale Modelle; in Domänen wie Gesundheit/Medizin, Industrie und Mobilität. Dafür kombinieren wir tiefgreifende linguistische Analysen mit modernstem maschinellem Lernen und neuronalen Ansätzen für NLP.

Weitere Informationen

Dialog & Chat

Durch Dialog- und Chattechnologien können Menschen mit Computern in natürlicher Sprache sprechen oder chatten. Zum einen können Computer natürliche Sprache verstehen, zum anderen können sie auch in natürlicher Sprache antworten. Ein Schwerpunkt am Speech and Language Technology Lab im Bereich Dialog und Chat liegt auf modularen Dialogsystemen: Wie kann man Dialogsysteme aufbauen, die aus mehreren Sub-Dialogsystemen zusammengesetzt sind? Diese modularen Dialogsysteme versprechen eine ganze Reihe von Vorteilen: Dialogsysteme können leicht in anderen Kontexten weiterverwendet werden; Sie können aus unterschiedlichen Technologien zusammengesetzt werden; Darüber hinaus verspricht diese modulare Technologie neue Möglichkeiten für Dialogmanagement und Multitasking in Dialogen.

Weitere Informationen

Linguistic Data Science

Die linguistische Datenwissenschaft behandelt die empirischen Aspekte der Linguistik wie beispielsweise Korpusannotationen oder statistische Auswertungen von Sprachdaten mit linguistischen Verfahren.

Ein wichtiges Thema dieses Forschungsfeldes, mit dem sich dass Speech and Technology Lab beschäftigt, ist die Frage, wie man Textqualität beschreibt.

Weitere Informationen

Language, Data and Knowledge Technologies

Im Themenfeld Language, Data and Knowledge Technologies beschäftigen wir uns mit allen notwendigen Technologiekomponenten, die für die Entwicklung, prototypische Demonstration sowie Nutzbarmachung und Wirkbetrieb von Sprachtechnologien notwendig sind, insbesondere in Bezug auf Anwendungen im professionellen Bereich der Kuratierung digitaler Inhalte (Kuratierungstechnologien). Dabei setzen wir unter anderem regelbasierte, aber auch datengetriebene neuronale sowie wissensbasierte Verfahren ein, die die symbolische und die subsymbolische Ebene miteinander kombinieren und die jeweiligen Vorteile nutzbar machen. Weitere Aspekte des Themenfeldes sind Einsatz und Entwicklung von Sprachtechnologieplattformen, die Einbettung der Forschungsarbeiten in die Entwicklung einer Strategie für technologiegestützte Mehrsprachigkeit in Europa und die Nutzbarmachung von Standardisierungsaktivitäten für das Themengebiet Sprachtechnologie.

Weitere Informationen

XplaiNLP

Die XplaiNLP-Gruppe an der TU Berlin und dem DFKI konzentriert sich auf die Entwicklung und Anwendung der Verarbeitung von natürlicher Sprache (NLP), mit einem Schwerpunkt auf Erklärbarkeit (xAI), Mensch-Computer-Interaktion (HCI) und rechtlicher Anpassung (AI Act, DSA). Die Gruppe setzt Große Sprachmodelle (LLMs) ein, um Herausforderungen in den Bereichen Fact-Checking, Wissensanreicherung und -abruf anzugehen, insbesondere in Feldern wie der Erkennung von Miss- und Desinformation, Hassrede und der Verarbeitung medizinischer Daten. Durch den Einsatz von erklärbarer KI strebt die XplaiNLP Gruppe an, die Transparenz und Verantwortlichkeit von KI-Systemen zu verbessern und sicherzustellen, dass deren Ergebnisse sowohl von Experten als auch von Laien interpretierbar sind. Die Gruppe erforscht zudem die rechtlichen und ethischen Dimensionen von KI-Systemen und trägt zu deren verantwortungsvollem Einsatz in der Gesellschaft bei.

Weitere Informationen: Themenfeld XplaiNLP

Interesse an einer Zusammenarbeit?

Ihre Ansprechperson für ein gemeinsames KI-Projekt:

Dr. phil. Sven Schmeier
Sven.Schmeier@dfki.de
Tel.: +49 30 23895 1815