Přejít k obsahu


Anotační systém transkripce a verifikace řečového korpusu pro úlohu syntézy řeči z textu s jednou instancí řečové jednotky

Citace:
MATOUŠEK, J., TIHELKA, D., ROMPORTL, J. Anotační systém transkripce a verifikace řečového korpusu pro úlohu syntézy řeči z textu s jednou instancí řečové jednotky. 2004.
Druh: Zaniklé typy
Jazyk publikace: cze
Anglický název: Annotation System for Transcription and Verification of Speech Corpus in Single-Unit-Instance Text-to-Speech Synthesis
Rok vydání: 2004
Název zdroje: Katedra kybernetiky, Fakulta aplikovaných věd Západočeské univerzity v Plzni
Autoři: Jindřich Matoušek , Daniel Tihelka , Jan Romportl
Abstrakt CZ: Anotační systém se využívá k transkripci a verifikaci řečových korpusů v úlohách syntézy řeči z textu s jednou instancí řečové jednotky. Obsahuje několik anotačních pravidel k co nejpřesnějšímu přepisu namluvených řečových signálů včetně pravidel pro přepis neřečových událostí (způsobených řečníkem – např. „hlasitý nádech“ nebo „výrazné mlasknutí“ -- nebo způsobených vlivem reálného nahrávacího prostředí – např. (vzdálené) „zvonění telefonu“ nebo „ťukání na dveře“). Součástí systému je také specifikace konvencí pro anotace srozumitelných i nesrozumitelných přeřeků a jiných odchylek od standardní výslovnosti. Protože konzistence stylu mluvení během nahrávání korpusu je v systémech TTS s jednou instancí řečové jednotky obrovsky významná a téměř monotónní mluvní styl je obecně v těchto typech systémů vyžadován, verifikace monotónnosti jednotlivých nahrávek je rovněž podporována.
Abstrakt EN: The annotation system is used to annotate and verify speech corpora in single-unit-instance text-to-speech synthesis tasks. Several annotation rules are defined to transcribe the recorded speech signals as close as possible, including those for non-speech events caused both by the donor speaker like “audible breath” or “extraordinary mouth click” and noises caused by the real-world environment like (remote) “phone ring”, “door knocking” etc. Conventions for annotating misspellings (both intelligible and unintelligible ones) and other deviations from standard pronunciations are also specified. As the consistency in speaking style is crucial for single-unit-instance TTS synthesis (and almost monotonous speaking style is generally required for this type of speech synthesis), checking each recording from the point of view of the monotonicity is also supported.
Klíčová slova

Zpět

Patička