Přejít k obsahu

SEARCHING FOR A ROBUST MFCC-BASED PARAMETRIZATION FOR ASR APPLICATION

Citace: PSUTKA, J., MÜLLER, L., ŠMÍDL, L., PSUTKA, J. SEARCHING FOR A ROBUST MFCC-BASED PARAMETRIZATION FOR ASR APPLICATION. In Signal and Image Processing. Anaheim: ACTA Press, 2007. s. 158-161. ISBN: 978-0-88986-675-1
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: SEARCHING FOR A ROBUST MFCC-BASED PARAMETRIZATION FOR ASR APPLICATION
Rok vydání: 2007
Místo konání: Anaheim
Název zdroje: ACTA Press
Autoři: Josef Psutka , Luděk Müller , Luboš Šmídl , Josef Psutka
Abstrakt CZ: Článek se zabývá vlivem redukce dimenze prostoru příznaků a vlivem dekorelačních technik na úspěšnost systému automatického rozpoznávání řeči. Baseline systém vychází z PLP parametrizace a z trénovací sady 1000 řečníků. V mnoha experimentech byly aplikovány a vzájemně porovnány technika Lineární Diskriminační analýzy (LDA), Heteroscedastická LDA (HLDA) a Vyhlazené HLDA (SHLDA), za účelem nalezení optimální dimenze příznakového prostoru.
Abstrakt EN: The paper studies the influence of significant space reduction and decorrelation techniques on the performance of an automatic speech recognition (ASR) system. A baseline PLP-based ASR system, which works with zero-gram language model, was trained using speech of one thousand speakers. The Linear Discriminant Analysis (LDA), Heteroscedastic LDA (HLDA) and Smoothed HLDA (SHLDA) techniques were applied and compared in many experiments in which an optimum dimension of a feature space was searched for.
Klíčová slova