#bert #tokenizer #port #google #original #word-piece

bert_tokenizer

这个软件包是谷歌 BERT WordPiece 分词器的 Rust 版本。

1 个不稳定版本

0.1.3 2023 年 2 月 15 日
0.1.2 2023 年 2 月 14 日
0.1.1 2023 年 2 月 14 日
0.1.0 2023 年 2 月 14 日

#15#bert

每月 25 次下载
bert_create_pretraining 中使用

自定义许可

225KB
373

bert_tokenizer

[ API 文档 | crates.io ]

该软件包提供了从 谷歌 BERT 仓库 的原始 BERT 分词器的移植。

许可

MIT 许可。请参阅 LICENSE 文件以获取完整许可。


lib.rs:

这个软件包是谷歌 BERT GoogleBERT WordPiece 分词器的 Rust 版本。

依赖关系

~2MB
~60K SLoC