Přejít k obsahu


On Building of Czech Spontaneous Speech Corpus

Citace: [] EKŠTEIN, K. On Building of Czech Spontaneous Speech Corpus. In Specom 2007 proceedings. Moscow: Moscow State Linguistic University , 2007. s. 913-918. ISBN: 5-7452-0110-X
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: On Building of Czech Spontaneous Speech Corpus
Rok vydání: 2007
Místo konání: Moscow
Název zdroje: Moscow State Linguistic University
Autoři: Kamil Ekštein
Abstrakt CZ: Článek popisuje celý proces sběru LAC, který se používá pro trénování rozpoznáváče LASER. Zvláštní pozornost je věnována tvorbě korpusu přirozené řeči LAC SS. Tvorba korpusu je popsaná od úvodních úvah, rozboru požadavků na materiál, vývoje potřebných nástrojů, výběru mluvčích a prostředí, přes záznam, transkripci, až po vyhodnocení kvality výsledku.
Abstrakt EN: This article describes the whole process of gathering the LAC corpora used to train the LASER automatic speech recognition system. Special focus is put onto our recent effort to build corpora of spontaneous speech, i.e. non-read speech, referenced to as LAC SS. The building of the copora is followed from initial considerations, through a design and development of necessary tools, a selection of material, environment and speakers, a recording, a transcription, to concluding quality evaluation of the collected corpora.
Klíčová slova

Zpět

Patička