#日语 #句子 #分词器 #NLP #文本

saku

简单而高效的基于规则的日语句子分词器

6个版本

0.1.6 2021年12月16日
0.1.5 2021年12月15日

#1817 in 文本处理

MIT 许可证

12KB
264

萨库:日语句子分词器

萨库 是一个基于Rust编写的规则库,用于将日语文本分割成句子。
“割く(saku)” 在日语中意为“分割某物”。

这个库以日本VTuber Saku Sasaki / 笹木咲的名字命名。

这是原始Rust实现的仓库。

无运行时依赖