Přejít k obsahu


Information Retrieval Test Collection for Searching Spontaneous Czech Speech

Citace: [] IRCING, P., PECINA, P., OARD, D., WANG, J., WHITE, R., HOIDEKR, J. Information Retrieval Test Collection for Searching Spontaneous Czech Speech. In Lecture Notes in Artificial Intelligence. Berlin: Springer, 2007. s. 439-446. ISBN: 978-3-540-74627-0
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Information Retrieval Test Collection for Searching Spontaneous Czech Speech
Rok vydání: 2007
Místo konání: Berlin
Název zdroje: Springer
Autoři: Pavel Ircing , Pavel Pecina , Douglas Oard , Jianqiang Wang , Ryen White , Jan Hoidekr
Abstrakt CZ: Článek popisuje vývoj první rozsáhlé testovací kolekce pro vyhledávání informací vytvořené pro český jazyk. Tvorba této kolekce je shodou okolností velkou výzvou, neboť kolekce je postavena na souvislém proudu textu z automatického přepisu spontánní řeči a jako taková postrádá jasně definované hranice mezi dokumenty. Článek představuje všechny aspekty budování kolekce, včetně některých obecných zjištění vzešlých z prvních experimentů.
Abstrakt EN: This paper describes the design of the first large-scale IR test collection built for the Czech language. The creation of this collection also happens to be very challenging, as it is based on a continuous text stream from automatic transcription of spontaneous speech and thus lacks clearly defined document boundaries. All aspects of the collection building are presented, together with some general findings of initial experiments.
Klíčová slova

Zpět

Patička