Přejít k obsahu


A comparison of two algorithms for discovering repeated word sequences

Citace: [] TESAŘ, R., FIALA, D., ROUSSELOT, F., JEŽEK, K. A comparison of two algorithms for discovering repeated word sequences. In Data mining VI. Southampton: WIT Press , 2005. s. 121-131. ISBN: 1-84564-017-9
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: A comparison of two algorithms for discovering repeated word sequences
Rok vydání: 2005
Místo konání: Southampton
Název zdroje: WIT Press
Autoři: Roman Tesař , Dalibor Fiala , Francois Rousselot , Karel Ježek
Abstrakt CZ: Čtenáři tohoto článku budou seznámeni s dvěma přístupy k hledání opakovaných sekvencí v textech - jedním je metoda založená na sufix tree stromech a druhá je založena na invertovaném seznamu. V závěru je uvedeno několik častých palikací opakovaných sekvencí.
Abstrakt EN: We will make the readers of this paper familiar with two basic approaches to repeated sequences extraction - a suffix tree based method and an inverted list based method. Finally, we will suggest several possible applications of repeated sequences.
Klíčová slova

Zpět

Patička