#chinese #convert #hanzi #traditional #localization #simplified

fast2s

一个快速的繁体中文到简体中文转换库。使用FST构建,比大多数其他库更快。

5个不稳定版本

0.3.1 2022年6月7日
0.3.0 2021年11月3日
0.2.1 2021年10月31日
0.2.0 2021年10月31日
0.1.0 2021年10月31日

#1529文本处理

Download history 338/week @ 2024-03-14 344/week @ 2024-03-21 501/week @ 2024-03-28 442/week @ 2024-04-04 357/week @ 2024-04-11 357/week @ 2024-04-18 443/week @ 2024-04-25 484/week @ 2024-05-02 654/week @ 2024-05-09 285/week @ 2024-05-16 370/week @ 2024-05-23 258/week @ 2024-05-30 495/week @ 2024-06-06 488/week @ 2024-06-13 388/week @ 2024-06-20 316/week @ 2024-06-27

1,756 每月下载量
5 个crate中使用 (4 直接使用)

MIT 许可证

26KB
223

fast2s

一个超级快速的繁体中文到简体中文翻译工具。

使用 hashbrown 构建翻译状态机。

使用方法

let t = "企畫 計畫 企劃 計劃 畫圖 畫畫";
let s = fast2s::convert(k);
assert_eq!(&s, "企划 计划 企划 计划 画图 画画");

基准测试

在 benches 目录下查看 simple.rs。我比较了与 opencc-rustsimplet2s-rscharacter_converter 的结果。由于 character_converter 太慢,我不得不将样本大小改为10,以免等待太长时间。

测试结果(转换并返回新字符串)

测试 fast2s simplet2s-rs opencc-rust character_conver
zht 188us 729us 5.98ms 1.23s
zhc 169us 941us 6.89ms 2.87s
en 69us 3.31ms 13.99ms 26.11s

测试结果(修改现有字符串)

测试 fast2s simplet2s-rs opencc-rust character_conver
zht 121us N/A N/A N/A
zhc 139us N/A N/A N/A
en 78us N/A N/A N/A

注意

  1. 基准测试在 rust 1.56.1 上进行。
  2. zht 表示加载 "math_zht.txt" 并进行翻译,zhc 表示加载 "math_zhc.txt" (全部为简体中文) 并进行翻译,en 表示加载 "math_en.txt" (全部为英语) 并进行翻译。
  3. N/A 表示不支持。

请勿直接信任基准测试结果,您应在本地环境中运行它。查看 如何运行基准测试

致谢

t2s.txtsimplet2s 复制而来。

依赖项

~1.1–1.6MB
~28K SLoC