#tantivy #bridge #adapter #tokenizer #jieba #jieba-rs

tantivy-jieba

一个连接tantivy和jieba-rs的库

12个版本 (重大更新)

0.11.0 2024年4月28日
0.10.0 2023年10月13日
0.9.0 2023年7月3日
0.7.0 2023年1月5日
0.1.1 2019年2月13日

#153 in 文本处理

Download history 1376/week @ 2024-05-02 3084/week @ 2024-05-09 2232/week @ 2024-05-16 2004/week @ 2024-05-23 2053/week @ 2024-05-30 1846/week @ 2024-06-06 1311/week @ 2024-06-13 2148/week @ 2024-06-20 2495/week @ 2024-06-27 2988/week @ 2024-07-04 2774/week @ 2024-07-11 2623/week @ 2024-07-18 2307/week @ 2024-07-25 2713/week @ 2024-08-01 2413/week @ 2024-08-08 1770/week @ 2024-08-15

9,653每月下载量

MIT许可证

8KB
104 代码行

tantivy-jieba

Crates.io version docs.rs Changelog FOSSA Status

一个连接tantivy和jieba-rs的适配器。

用法

将依赖项tantivy-jieba添加到您的Cargo.toml

示例

use tantivy::tokenizer::*;
let mut tokenizer = tantivy_jieba::JiebaTokenizer {};
let mut token_stream = tokenizer.token_stream("测试");
assert_eq!(token_stream.next().unwrap().text, "测试");
assert!(token_stream.next().is_none());

注册tantivy分词器

use tantivy::schema::Schema;
use tantivy::tokenizer::*;
use tantivy::Index;
let tokenizer = tantivy_jieba::JiebaTokenizer {};
let index = Index::create_in_ram(schema);
index.tokenizers()
     .register("jieba", tokenizer);

许可证

FOSSA Status

依赖项

~9.5MB
~96K SLoC