12个版本 (重大更新)
0.11.0 | 2024年4月28日 |
---|---|
0.10.0 | 2023年10月13日 |
0.9.0 | 2023年7月3日 |
0.7.0 | 2023年1月5日 |
0.1.1 | 2019年2月13日 |
#153 in 文本处理
9,653每月下载量
8KB
104 代码行
tantivy-jieba
一个连接tantivy和jieba-rs的适配器。
用法
将依赖项tantivy-jieba
添加到您的Cargo.toml
。
示例
use tantivy::tokenizer::*;
let mut tokenizer = tantivy_jieba::JiebaTokenizer {};
let mut token_stream = tokenizer.token_stream("测试");
assert_eq!(token_stream.next().unwrap().text, "测试");
assert!(token_stream.next().is_none());
注册tantivy分词器
use tantivy::schema::Schema;
use tantivy::tokenizer::*;
use tantivy::Index;
let tokenizer = tantivy_jieba::JiebaTokenizer {};
let index = Index::create_in_ram(schema);
index.tokenizers()
.register("jieba", tokenizer);
许可证
依赖项
~9.5MB
~96K SLoC