#thai #nlp #library #text

chawuek

AttaCut 转译的泰语词分割/断词库

1 个不稳定版本

0.1.0 2021年7月16日

#11 in #thai


用于 khatson

Apache-2.0

660KB
117

包含 (压缩文件, 710KB) data/attacut-c/model.pt

chawuek

Attacut 泰语词分词器移植到 Rust

状态

工作进行中

依赖

~8–11MB
~226K SLoC