Přejít k obsahu


Listening-test-based annotation of communicative functions for expressive speech synthesis

Citace: [] GRŮBER, M., MATOUŠEK, J. Listening-test-based annotation of communicative functions for expressive speech synthesis. Lecture Notes in Artificial Intelligence, 2010, roč. 2010, č. 6231, s. 283-290. ISSN: 0302-9743
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Listening-test-based annotation of communicative functions for expressive speech synthesis
Rok vydání: 2010
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Martin Grůber , Doc. Ing. Jindřich Matoušek Ph.D.
Abstrakt CZ: Článek popisuje vyhodnocení poslechového testu, jehož cílem bylo objektivně anotovat expresivní řečové nahrávky a tím dále vyvíjet doménově omezený syntetizér expresivní řeči. V této úloze jsou dva základní problémy. Prvním z nich je fakt, že expresivita jako taková musí být předem nějakým způsobem definována. Druhým problémem je subjektivní vnímání expresivní řeči různými posluchači. Nicméně, pro správnou funkci expresivního řečového syntetizéru musí být expresivní korpus objektivně a jednoznačně anotován. Nejprve jsme definovali expresivitu pomocí tzv. komunikačních funkcí. Předpokládáme, že pomocí těchto funkcí jsme schopni popsat způsob expresivního vyjádření v mluvené řeči. Abychom dosáhli objektivní anotace, vytvořili jsme poslechový test pro relativně velkou množinu posluchačů. Posluchači v tomto poslechovém testu měli za úkol označit věty z expresivního korpusu odpovídajícími komunikačními funkcemi. Naším cílem bylo získat co nejvíce těchto subjektivních anotací a pomocí již známých metod z těchto subjektivních anotací získat anotaci objektivní.
Abstrakt EN: This paper is focused on the evaluation of listening test that was realized with a view to objectively annotate expressive speech recordings and further develop a limited domain expressive speech synthesis system. There are two main issues to face in this task. The first matter in issue to be taken into consideration is the fact that expressivity in speech has to be defined in some way. The second problem is that perception of expressive speech is a subjective question. However, for the purposes of expressive speech synthesis using unit selection algorithms, the expressive speech corpus has to be objectively and unambiguously annotated. At first, a classification of expressivity was determined making use of communicative functions. These are supposed to describe the type of expressivity and/or speaker?s attitude. Further, to achieve objectivity at a significant level, a listening test with relatively high number of listeners was realized. The listeners were asked to mark sentences in the corpus using communicative functions. The aim of the test was to acquire a sufficient number of subjective annotations of the expressive recordings so that we would be able to create ?objective? annotation. There are several methods to obtain objective evaluation from lots of subjective ones, two of them are presented.
Klíčová slova

Zpět

Patička