#韩语 #NLP #分析器 #分词器

bareun_rs

Bareun 是一个用于 Rust 的韩语形态分析器

1 个不稳定版本

0.1.0 2024年6月7日

#1488文本处理

BSD-3-Clause

51KB
826 代码行

bareun-rs 是一个非官方的 Rust 库,用于 Bareun,一个韩语形态分析器。
Bareun 是一个韩语 NLP,提供韩语的分词和词性标注。


lib.rs:

bareun_rs::bareun

提供

  1. 作为 bareun 客户端的韩语词性标注器
  2. 多个自定义字典,存储在您的 bareun 服务器上。

如何使用文档

bareun 的完整文档可在可安装的 tarball 或 docker 图像中找到。

  • 在可安装的 tarball 中查看 docs/intro.html
  • 或在运行 docker 后查看 https://127.0.0.1:5757/intro.html

示例文档字符串假定已将 bareun_rs::bareun 导入为 brn:

use bareun_rs::bareun as brn;

使用内置的 help 函数查看类的文档字符串:

help(brn::Tagger) ...

Tagger 韩语 bareun 词性标注器 use bareun_rs::bareun::Tagger; 标注输出包装器 use bareun_rs::bareun::Tagged; CustomDict 韩语自定义字典。 use bareun_rs::bareun::CustomDict;

版本

use bareun_rs as brn;
println!("{}", brn::VERSION);
println!("{}", brn::BAREUN_VERSION);

获取 bareun

依赖项

~5–12MB
~128K SLoC