Lib
.rs
›
科学
›
机器学习
#
tokenizer
#
version
#
python
bytepiece
Rust版本的bytepiece分词器
由
SunDoge
编写
安装
API参考
GitHub仓库
(
sundoge
)
2个不稳定版本
0.2.0
2023年9月26日
0.1.0
2023年9月21日
#
625
in
机器学习
Apache-2.0
12KB
230
代码行
bytepiece
依赖项
~4.5–6.5MB
~120K
SLoC
aho-corasick
base64-simd
once_cell
ouroboros
0.18
rand
regex
serde
+
derive
serde_json
thiserror
dev
bytepiece_rs
dev
criterion
0.5.1