Přejít k obsahu


Slovak Unit-Selection Speech Synthesis: Creating a New Slovak Voice within a Czech TTS System ARTIC

Citace: [] MATOUŠEK, J., TIHELKA, D., ROMPORTL, J., PSUTKA, J. Slovak Unit-Selection Speech Synthesis: Creating a New Slovak Voice within a Czech TTS System ARTIC. IAENG International Journal of Computer Science, 2012, roč. 39, č. 2, s. 147-154. ISSN: 1819-656X
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Slovak Unit-Selection Speech Synthesis: Creating a New Slovak Voice within a Czech TTS System ARTIC
Rok vydání: 2012
Autoři: Doc. Ing. Jindřich Matoušek Ph.D. , Ing. Daniel Tihelka Ph.D. , Ing. Jan Romportl Ph.D. , Prof. Ing. Josef Psutka CSc. ,
Abstrakt CZ: ARTIC (Artificial Talker in Czech) je korpusově orientovaný systém syntézy řeči z textu (TTS), který umožňuje syntetizovat libovolný text (hlavně pro český jazyk). V principu existují dvě verze systému - systém s jednou instancí řečových jednotek (označovaný také systém s pevným inventářem), s kvalitou výsledné syntetické řeči omezenou daným pevným inventářem, a systém s více instancemi řečových jednotek s kvalitou profitující z využití algoritmu výběru jednotek, který vybírá nejdelší vhodnou posloupnost fonetických jednotek z mnoha možných. V tomto článku je popsán proces vytváření nového slovenského hlasu do systému ARTIC s více instancemi řečových jednotek. V článku jsou popsány všechny kroky, od přípravy vhodného řečového korpusu až po vytvoření inventáře akustických jednotek nového slovenského hlasu a jeho využití v systému ARTIC. Dále je podrobně popsán modul zpracování libovolného slovenského textu, včetně automatické fonetické transkripce a symbolického prozodického popisu. Závěrem je rovněž zmíněn modul vytváření řeči založený na algoritmu výběru jednotek.
Abstrakt EN: ARTIC (Artificial Talker in Czech) is a corpus-based text-to-speech (TTS) system that enables to synthesise an arbitrary text, mainly for the Czech language. Basically, two versions of ARTIC are available - a single unit instance system (also known as fixed-inventory synthesis) with the quality of resulting speech limited by the fixed inventory, and multiple unit instance system with the quality profitting from employing a unit-selection algorithm to select the longest suitable sequence of phonetic units from many units available. In this paper, a process of building a new Slovak voice for the unit-selection version of ARTIC is presented. All steps in the design, from the preparation of a suitable speech corpus to the creation of an acoustic unit inventory of the new Slovak voice and its use in the ARTIC system will be described. Text processing module, including automatic phonetic transcription and symbolic prosodic description of an arbitrary Slovak text, will be detailed. Finally, speech production module based on the unit selection algorithm will be mentioned as well.
Klíčová slova

Zpět

Patička