12个版本 (重大更新)

0.11.0 2024年4月28日
0.10.0 2023年10月13日
0.9.0 2023年7月3日
0.7.0 2023年1月5日
0.1.1 2019年2月13日

#153 in 文本处理

Download history · Rust 包仓库 1376/week @ 2024-05-02 · Rust 包仓库 3084/week @ 2024-05-09 · Rust 包仓库 2232/week @ 2024-05-16 · Rust 包仓库 2004/week @ 2024-05-23 · Rust 包仓库 2053/week @ 2024-05-30 · Rust 包仓库 1846/week @ 2024-06-06 · Rust 包仓库 1311/week @ 2024-06-13 · Rust 包仓库 2148/week @ 2024-06-20 · Rust 包仓库 2495/week @ 2024-06-27 · Rust 包仓库 2988/week @ 2024-07-04 · Rust 包仓库 2774/week @ 2024-07-11 · Rust 包仓库 2623/week @ 2024-07-18 · Rust 包仓库 2307/week @ 2024-07-25 · Rust 包仓库 2713/week @ 2024-08-01 · Rust 包仓库 2413/week @ 2024-08-08 · Rust 包仓库 1770/week @ 2024-08-15 · Rust 包仓库

9,653每月下载量

MIT许可证

8KB
104 代码行

tantivy-jieba

Crates.io version docs.rs Changelog FOSSA Status

一个连接tantivy和jieba-rs的适配器。

用法

将依赖项tantivy-jieba添加到您的Cargo.toml

示例

use tantivy::tokenizer::*;
let mut tokenizer = tantivy_jieba::JiebaTokenizer {};
let mut token_stream = tokenizer.token_stream("测试");
assert_eq!(token_stream.next().unwrap().text, "测试");
assert!(token_stream.next().is_none());

注册tantivy分词器

use tantivy::schema::Schema;
use tantivy::tokenizer::*;
use tantivy::Index;
let tokenizer = tantivy_jieba::JiebaTokenizer {};
let index = Index::create_in_ram(schema);
index.tokenizers()
     .register("jieba", tokenizer);

许可证

FOSSA Status

依赖项

~9.5MB
~96K SLoC