使用 Vibrato 的 Tantivy 分词器
作者: UEDA Akira
#41 in #tantivy
7KB 154 行
一个使用 Tantivy 的 Vibrato 分词器。
let tokenizer = VibratoTokenizer::new("/path/to/dictionary")?; let analyzer = TextAnalyzer::from(tokenizer).filter(LowerCaser); index.tokenizers().register("lang_ja", analyzer);
您需要指定 Vibrato 字典文件的路径。
~21MB ~350K SLoC