Přejít k obsahu


What Can and Cannot Be Found in Czech Spontaneous Speech Using Document-Oriented IR Methods ? UWB at CLEF 2007 CL-SR Track

Citace: [] IRCING, P., PSUTKA, J., VAVRUŠKA, J. What Can and Cannot Be Found in Czech Spontaneous Speech Using Document-Oriented IR Methods ? UWB at CLEF 2007 CL-SR Track. Lecture Notes in Computer Science, 2008, roč. 5152, č. 5152, s. 712-718. ISSN: 0302-9743
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: What Can and Cannot Be Found in Czech Spontaneous Speech Using Document-Oriented IR Methods ? UWB at CLEF 2007 CL-SR Track
Rok vydání: 2008
Autoři: Pavel Ircing , Josef Psutka , Jan Vavruška
Abstrakt CZ: Článek představuje přehled systémů postavených a experimentů provedených pro CLEF 2007 CL-SR track týmem Západočeské univerzity. Soustředili jsme se pouze na monolingvní experimenty s českou testovací kolekcí. Přístup, který jsme úspěšně použili v minulé kampani (jednoduchý tf.idf model se slepou zpětnou vazbou, se solidním lingvistickým předzpracováním) byl použit znovu, ale množina provedených experimentů byla rozšířena a dosažené výsledky důkladněji rozebrány.
Abstrakt EN: The paper presents an overview of the system build and experiments performed for the CLEF 2007 CL-SR track by the University of West Bohemia. We have concentrated on the monolingual experiments using the Czech collection only. The approach that was successfully employed by our team in the last year?s campaign (simple tf.idf model with blind relevance feedback, accompanied with solid linguistic preprocessing) was used again but the set of performed experiments was broadened and a more detailed analysis of the results is provided.
Klíčová slova

Zpět

Patička