16 个重大版本发布
0.18.0 | 2023年11月4日 |
---|---|
0.16.0 | 2023年6月11日 |
0.15.0 | 2023年2月12日 |
0.14.0 | 2022年7月13日 |
0.1.0 | 2018年9月18日 |
#21 in #tantivy
每月 132 次下载
在 8 个 crate 中使用 (直接使用 5 个)
7KB
101 代码行
cang-jie(仓颉)
目前仅支持 UTF-8。
示例
let mut schema_builder = SchemaBuilder::default();
let text_indexing = TextFieldIndexing::default()
.set_tokenizer(CANG_JIE) // Set custom tokenizer
.set_index_option(IndexRecordOption::WithFreqsAndPositions);
let text_options = TextOptions::default()
.set_indexing_options(text_indexing)
.set_stored();
// ... Some code
let index = Index::create(RAMDirectory::create(), schema.clone())?;
let tokenizer = CangJieTokenizer {
worker: Arc::new(Jieba::empty()), // empty dictionary
option: TokenizerOption::Unicode,
};
index.tokenizers().register(CANG_JIE, tokenizer);
// ... Some code
依赖项
~29MB
~424K SLoC