Přejít k obsahu


Correction of Prosodic Phrases in Large Speech Corpora

Citace:
HANZLÍČEK, Z. Correction of Prosodic Phrases in Large Speech Corpora. In Text, Speech, and Dialogue 19th International Conference, TSD 2016, Brno , Czech Republic, September 12-16, 2016, Proceedings. Heidelberg: Springer, 2016. s. 408-417. ISBN: 978-3-319-45509-9 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Correction of Prosodic Phrases in Large Speech Corpora
Rok vydání: 2016
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Zdeněk Hanzlíček Ph.D. ,
Abstrakt CZ: V řadě úloh z oblasti zpracování řeči, jako např. rozpoznávání a syntéza řeči, pracujeme s velkými objemy dat. Pro dosažení co nejlepších výsledků je nutné, aby tato data byla správně anotována. Tento článek se zabývá problémy spojenými s prozodickou anotací v českých řečových korpusech. Použitý prozodický model předpokládá, že promluva je rozdělena krátkými odmlkami do tzv. prozodických klauzí, ty se dále dělí do tzv. frází. Typy jednotlivých frází jsou svázány s posledními prozodickými slovy, které odpovídají různým typům tzv. funkčních prozodémů. Struktura frází a klauzí je významně určena stavbou věty, avšak v reálných promluvách často typ prozodému, resp. hranice frází a klauzí tomu zcela neodpovídají. Článek se zabývá 2 problémy: opravou špatně určeného typu fráze/prozodému a opravou chybných hranic frází. Pro oba případy byla navržena nová metoda využívající skryté Markovovy modely. Experimenty byly provedeny na 4 velkých řečových korpusech. Výsledky byly ověřeny poslechovými testy.
Abstrakt EN: Nowadays, in many speech processing tasks, such as speech recognition and synthesis, really large speech corpora are utilized. These speech corpora usually contain several hours of speech or even more. To achieve possibly best results, an appropriate annotation of the recorded utterances is often necessary. This paper is focused on problems related to the prosodic annotation of the Czech speech corpora. In the Czech language, the utterances are supposed to be split by pauses into so-called prosodic clauses containing one or more prosodic phrases. The types of particular phrases are linked to their last prosodic words corresponding to various functionally involved prosodemes. The clause/phrase structure is substantially determined by the sentence composition. However, in real speech data, different prosodeme type or even phrase/clause borders can be present. This paper deals with 2 basic problems: the correction of the improper prosodeme/phrase type and the detection of new phrase borders. For both tasks, we proposed new procedures utilizing hidden Markov models. Experiments were performed on 4 large speech corpora recorded by professional speakers for the purpose of speech synthesis. These experiments were limited to the declarative sentences. The results were successfully verified by listening tests.
Klíčová slova

Zpět

Patička