Přejít k obsahu


Prosodic Phrase Annotation in Czech Corpus

Citace:
ROMPORTL, J. Prosodic Phrase Annotation in Czech Corpus. In Speech Processing. Prague: Institute of Photonics and Electronics, Academy of Sciences of the Czech Republic, 2009. s. 80-83. ISBN: 978-80-86269-18-4
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Prosodic Phrase Annotation in Czech Corpus
Rok vydání: 2009
Místo konání: Prague
Název zdroje: Institute of Photonics and Electronics, Academy of Sciences of the Czech Republic
Autoři: Ing. Jan Romportl Ph.D.
Abstrakt CZ: Má-li být zvýšena přirozenost řeči syntetizované systémem TTS s výběrem jednotek, je nezbytné, aby byly v celém zdrojovém korpusu označeny hranice prozodických frází. Je ovšem velice obtížné dosáhnout toho manuální anotací, proto je nutné využít metod umělé inteligence, zejména pak strojového učení a klasifikace. Tyto metody však vyžadují spolehlivé a objektivně označené soubory testovacích a trénovacích dat. V tomto článku je popsána metoda objektivního označení prozodických frází v řečovém korpusu, která je schopna požadované soubory vytvořit. Je založena na statistickém vyhodnocení dat získaných z poslechových testů, přičemž využívá metody maximální věrohodnosti a algoritmu EM.
Abstrakt EN: In order to improve speech naturalness of a unit selection TTS system it is necessary to annotate prosodic phrase boundaries in the whole source corpus, which is extremely difficult to achieve manually. However, automatic machine learning methods require reliable training and testing sets. This paper describes an objective method for assignment of prosodic phrases in read speech data, which is able to produce such reliable sets. The method is based on statistical evaluation of listening test data by a maximum-likelihood approach with parameters estimated by an EM algorithm.
Klíčová slova

Zpět

Patička