Přejít k obsahu


Czech Monolingual Information Retrieval Using Off-The-Shelf Components - the University of West Bohemia at CLEF 2007 Ad-Hoc track

Citace:
IRCING, P., MÜLLER, L. Czech Monolingual Information Retrieval Using Off-The-Shelf Components - the University of West Bohemia at CLEF 2007 Ad-Hoc track. DELOS network of excellence on digital libraries, 2007, roč. 2007, č. 1, s. 1-4. ISSN: 1818-8044
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Czech Monolingual Information Retrieval Using Off-The-Shelf Components - the University of West Bohemia at CLEF 2007 Ad-Hoc track
Rok vydání: 2007
Autoři: Pavel Ircing , Luděk Müller
Abstrakt CZ: Článek stručně popisuje systém sestavený pro CLEF 2007 Ad-Hoc track Západočeskou univerzitou. Provedli jsme pouze monolingvní experimenty (české dokumenty - české dotazy), využívajíc dvě verze tf.idf modelu - jednu se surovými frekvencemi termů a druhou s BM25 vážením frekvencí termů - implementované v nástroji Lemur. Zkoumali jsme také vliv slepé zpětné vazby. Pro lematizaci a odstranění stop slov byl použit český morfologický analyzátor a tagger.
Abstrakt EN: The paper provides a brief description of the system assembled for the CLEF 2007 Ad-Hoc track by the University of West Bohemia. We have performed only monolingual experiments (Czech documents - Czech queries) using two incarnations of the tf.idf model - one with raw term frequency and the other with the BM25 term frequency weighting - as implemented in the Lemur toolkit. The effect of the blind relevance feedback was also explored. Czech morphological analyser and tagger were used for lemmatization and stop word removal.
Klíčová slova

Zpět

Patička