Přejít k obsahu


Experiments with One–Class Classifier as a Predictor of Spectral Discontinuities in Unit Concatenation

Citace:
TIHELKA, D., GRŮBER, M., JŮZOVÁ, M. Experiments with One?Class Classifier as a Predictor of Spectral Discontinuities in Unit Concatenation. In Speech and Computer 18th International Conference, SPECOM 2016, Budapest, Hungary, August 23-27, 2016, Proceedings. Heidelberg: Springer, 2016. s. 296-303. ISBN: 978-3-319-43957-0 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Experiments with One?Class Classifier as a Predictor of Spectral Discontinuities in Unit Concatenation
Rok vydání: 2016
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Daniel Tihelka Ph.D. , Ing. Martin Grůber Ph.D. , Ing. Markéta Jůzová
Abstrakt CZ: V článku představujeme řadu experimentů s klasifikací one-class (klasifikací do jedné třídy, či též detekcí anomálií), zaměřených na zkoumání schopnosti této skupiny klasifikátorů detekovat spektrální nespojitost řečových jednotek, což by šlo využít jako alternativu k heuristicky navržených měřeních nespojitostí používaných při syntéze řeči metodou dynamického výběru jednotek. Pro klasifikaci byla v přirozeném řečovém signálu spočtena sada vzdáleností spektrálních příznaků mezi sousedícími okénky, tj. mezi těmi částmi signálu, které reprezentují přirozené spojení řečových segmentů. Klasifikátor byl trénován na této množině vzdáleností pro jednotlivé samohlásky. Celkem bylo prověřeno chování tří typů klasifikátorů (one-class) na vzdálenostech vypočtených z několika různých způsobů okénkování. Schopnost detekovat spektrální nespojitosti ve spojích řečových segmentů natrénovanými klasifikátory byla ověřena oproti vnímání těchto nespojitostí lidskými posluchači, jejichž hodnocení byly získány ve speciálně k tomuto účelu navrženém poslechovém testu.
Abstrakt EN: We present a sequence of experiments with one?class classification, aimed at examining the ability of such a classifier to detect spectral smoothness of units, as an alternative to heuristics?based measures used within unit selection speech synthesizers. A set of spectral feature distances was computed between neighbouring frames in natural speech recordings, i.e. those representing natural joins, from which the per?vowel classifier was trained. In total, three types of classifiers were examined for distances computed from several different signal parametrizations. For the evaluation, the trained classifiers were tested against smooth or discontinuous joins as they were perceived by human listeners in the ad?hoc listening test designed for this purpose.
Klíčová slova

Zpět

Patička