Projekt | PAVOQUE

Laufzeit: 01.05.2006 - 30.06.2008

PArametrisation of prosody and VOice QUality for concatenative speech synthesis in view of Emotion expression

Ein Haupthindernis für die Akzeptanz von Sprachsynthese ist ihre mangelnde Ausdruckskraft. Um z.B. den emotionalen Gehalt von Äußerungen angemessen vermitteln zu können, müsste der Klang der synthetischen Stimme verändert werden; jedoch fehlt neueren Sprachsyntheseverfahren die Möglichkeit, die relevanten Parameter im nötigen Umfang zu beeinflussen.

In der Sprachsynthese sind derzeit Natürlichkeit und Flexibilität nicht vereinbar: neuere korpus-basierte Unit Selection Syntheseverfahren klingen zwar oft natürlich, können aber nur einen einzigen Sprechstil realisieren, der bei der Aufnahme des Sprachkorpus bestimmt wird. Dem gegenüber stehen ältere Verfahren wie Formant- oder Diphonsynthese, die zwar parametrisierbar sind, aber recht unnatürlich klingen. Es existiert derzeit keine Synthesemethode, die die Natürlichkeit korpus-basierter Synthese mit der Parametrisierbarkeit früherer Systeme verbindet.

Das Projekt PAVOQUE soll einen wesentlichen Beitrag dazu leisten, diese Unvereinbarkeit von Synthesequalität und Parametrisierbarkeit zu überwinden. In einem aktuellen, korpus-basierten Sprachsynthesesystem erforscht es Methoden für die nötige Parametrisierbarkeit der Schlüsselparameter für den Ausdruck von Emotionen in der Stimme: Prosodie (=Intonation und Rhythmus) und Stimmqualität. Zwei Lösungsansätze werden verfolgt: Parameter-basierte Selektion von Units aus dem Korpus, und Nachverarbeitung des synthetischen Sprachsignals mit Signalmanipulationsverfahren. Dadurch soll ein hohes Maß an Ausdruckskraft bei gleichbleibend guter Qualität des Sprachsignals bereitgestellt werden.

Keyfacts

Beteiligte Forschungsbereiche

Webseite

http://mary.dfki.de/pavoque

Publikationen

Alle Publikationen

The PAVOQUE corpus as a resource for analysis and synthesis of expressive speech
Ingmar Steiner; Marc Schröder; Annette Klepp
In: Phonetik & Phonologie 9. Phonetik & Phonologie (P&P-9), October 11-12, Zurich, Switzerland, Pages 83-84, Peter Lang, 10/2013.
Open source voice creation toolkit for the MARY TTS Platform
Marc Schröder; Marcela Charfuelan Oliva; Sathish Pammi; Ingmar Steiner
In: 12th Annual Conference of the International Speech Communication Association. Conference in the Annual Series of Interspeech Events (INTERSPEECH-2011), 12th, August 28-31, Florence, Italy, ISCA, 8/2011.
Multilingual Voice Creation Toolkit for the MARY TTS Platform
Sathish Chandra Pammi; Marcela Charfuelan Oliva; Marc Schröder
In: Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10). International Conference on Language Resources and Evaluation (LREC-2010), May 19-21, Valleta, Malta, ISBN 2-9517408-6-7, ELRA, 5/2010.

Projekt | PAVOQUE

PArametrisation of prosody and VOice QUality for concatenative speech synthesis in view of Emotion expression

Keyfacts

Beteiligte Forschungsbereiche

Webseite

Publikationen

The PAVOQUE corpus as a resource for analysis and synthesis of expressive speech

Open source voice creation toolkit for the MARY TTS Platform

Multilingual Voice Creation Toolkit for the MARY TTS Platform

Fördergeber

DFG - Deutsche Forschungsgemeinschaft

Projekt teilen auf:

Keyfacts

Beteiligte Forschungsbereiche

Webseite

The PAVOQUE corpus as a resource for analysis and synthesis of expressive speech

Open source voice creation toolkit for the MARY TTS Platform

Multilingual Voice Creation Toolkit for the MARY TTS Platform

Fördergeber

DFG - Deutsche Forschungsgemeinschaft