#tantivy #tokenizer #vibrato

tantivy-vibrato

使用 Vibrato 的 Tantivy 分词器

1 个不稳定版本

0.3.0 2023年1月19日

#41 in #tantivy

自定义许可

7KB
154

tantivy-vibrato

一个使用 TantivyVibrato 分词器。

用法

let tokenizer = VibratoTokenizer::new("/path/to/dictionary")?;
let analyzer = TextAnalyzer::from(tokenizer).filter(LowerCaser);
index.tokenizers().register("lang_ja", analyzer);

您需要指定 Vibrato 字典文件的路径。

依赖项

~21MB
~350K SLoC