41次发布

0.7.0	2024年4月16日
0.6.8	2023年7月16日
0.6.7	2022年10月3日
0.6.6	2021年11月9日
0.2.3	2018年7月6日

#63 在文本处理

22,339 每月下载量
在 18 个包中使用 (直接使用13个)

MIT 许可证

4.5MB
2K SLoC

jieba-rs

🚀 通过在GitHub上赞助我帮助我成为全职开源开发者

在Rust中实现的Jieba中文分词

安装

将其添加到您的 Cargo.toml

[dependencies]
jieba-rs = "0.6"

然后您就可以使用了。如果您使用的是Rust 2015，则还必须在包根目录中添加 extern crate jieba_rs。

示例

use jieba_rs::Jieba;

fn main() {
    let jieba = Jieba::new();
    let words = jieba.cut("我们中出了一个叛徒", false);
    assert_eq!(words, vec!["我们", "中", "出", "了", "一个", "叛徒"]);
}

启用额外功能

default-dict 特性启用嵌入式词典，此特性默认启用
tfidf 特性启用TF-IDF关键词提取器
textrank 特性启用TextRank关键词提取器

[dependencies]
jieba-rs = { version = "0.6", features = ["tfidf", "textrank"] }

运行基准测试

cargo bench --all-features

基准测试：与cppjieba比较

`jieba-rs` 绑定

许可证

此作品在MIT许可证下发布。许可证副本提供在LICENSE文件中。

依赖

~3–5MB
~89K SLoC

41次发布

jieba-rs

安装

示例

启用额外功能

运行基准测试

基准测试：与cppjieba比较

jieba-rs 绑定

许可证

依赖

`jieba-rs` 绑定