Přejít k obsahu


Acoustic Analysis of Czech Expressive Recordings from a Single Speaker in Terms of Various Communicative Functions

Citace: [] GRŮBER, M. Acoustic Analysis of Czech Expressive Recordings from a Single Speaker in Terms of Various Communicative Functions. In Proceedings of the 11thIEEE International Symposium on Signal Processing and Information Technology. 345 E 47TH ST, NEW YORK, NY 10017: IEEE, 2011. s. 293-298. ISBN: 978-1-4673-0753-6
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Acoustic Analysis of Czech Expressive Recordings from a Single Speaker in Terms of Various Communicative Functions
Rok vydání: 2011
Místo konání: 345 E 47TH ST, NEW YORK, NY 10017
Název zdroje: IEEE
Autoři: Ing. Martin Grůber
Abstrakt CZ: Tato práce popisuje rozsáhlou akustickou analýzu řečových nahrávek, které byly namluveny jednou českou ženskou mluvčí s využitím různých expresivních řečnických stylů. Nahrávání expresivně zabarvených textů bylo provedeno formou dialogu mezi člověkem a počítačem na dané téma. Řeč člověka (mluvčího) byla nahrána a později pečlivě ručně přepsána. Řečové nahrávky také byly anotovány pomocí poslechového testu. Cílem těchto anotací bylo přiřadit každé promluvě odpovídající řečnický styl (tzv. komunikační funkci). Na základě takového označení byly expresivní nahrávky rozděleny do různých skupin a akusticky analyzovány. Zejména jsme kladli důraz na některé rysy, které mají vliv na vnímání řeči, jako F0, doba trvání fonémů, formantové frekvence a RMS energie. Snažili jsme se odhalit některé akustické rozdíly mezi jednotlivými řečnickými styly, které by nám mohly pomoci vylepšit expresivní syntézu řeči v dané omezené oblasti.
Abstrakt EN: This paper presents an extensive acoustic analysis of utterances which were recorded by a single Czech female speaker using various expressive speaking styles. The recording of the expressive utterances was performed as a dialogue between a human and a computer on a given topic. Speech of the human speaker was captured and later carefully transcribed by human annotators. It was also annotated using a listening test. The aim of the annotations was to label each utterance with a corresponding speaking style (referred to as a communicative function). Based on such a labeling, the expressive recordings were classified into various groups and acoustically analyzed. In particular, we placed emphasis on some features which are supposed to influence the perception of speech, such as F0, phoneme duration, formant frequencies or energy. We made an effort to reveal some acoustic differences between the various speaking styles that could help us to improve expressive speech synthesis in a given limited domain.
Klíčová slova

Zpět

Patička