Přejít k obsahu


On Building a New Slovak Voice for the Czech Unit-Selection TTS System ARTIC

Citace:
MATOUŠEK, J., TIHELKA, D., GRŮBER, M. On Building a New Slovak Voice for the Czech Unit-Selection TTS System ARTIC. In Speech Processing. Prague: Institute of Photonics and Electronics AS CR, 2010. s. 140-146. ISBN: 978-80-86269-21-4
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: On Building a New Slovak Voice for the Czech Unit-Selection TTS System ARTIC
Rok vydání: 2010
Místo konání: Prague
Název zdroje: Institute of Photonics and Electronics AS CR
Autoři: Doc. Ing. Jindřich Matoušek Ph.D. , Ing. Daniel Tihelka Ph.D. , Ing. Martin Grůber
Abstrakt CZ: ARTIC (Artificial Talker in Czech) je korpusově orientovaný systém syntézy řeči z textu (TTS), který umožňuje syntetizovat libovolný text (hlavně pro český jazyk). Existují dvě verze systému - systém s jednou instancí řečových jednotek (označovaný také systém s pevným inventářem), s kvalitou výsledné syntetické řeči omezenou daným pevným inventářem a systém s více instancemi řečových jednotek s kvalitou profitující z využití algoritmu výběru jednotek, který vybírá nejdelší vhodnou posloupnost fonetických jednotek z mnoha možných. V tomto článku je popsán proces vytváření nového slovenského hlasu do systému ARTIC s více instancemi řečových jednotek. V článku jsou popsány všechny kroky, od přípravy vhodného řečového korpusu až po vytvoření inventáře akustických jednotek nového slovenského hlasu a jeho využití v systému ARTIC. Zvláštní pozornost je věnována popisu fonetických charakteristik slovenštiny a problémům zpracování textu v reálném čase syntézy řeči.
Abstrakt EN: ARTIC (Artificial Talker in Czech) is a corpus-based text-to-speech (TTS) system that enables to synthesize an arbitrary text, mainly for the Czech language. Basically, two versions of ARTIC are available ? a single unit instance system (also known as fixed-inventory synthesis, e.g. diphone-based synthesis) with the quality of resulting speech limited by the fixed inventory, and multiple unit instance system with the quality profiting from employing a unit selection algorithm to select the longest suitable sequence of phonetic units from many units available. In this paper, a process of building a new Slovak voice for the unit selection version of ARTIC is presented. All steps in the design, from the preparation of a suitable speech corpus to the creation of an acoustic unit inventory of the new Slovak voice and its use in the ARTIC system will be described. Special focus will be given to the description of both phonetic features of Slovak and issues in real-time text processing.
Klíčová slova

Zpět

Patička