12个版本 (稳定版)
2.1.5 | 2023年11月10日 |
---|---|
2.1.4 | 2022年10月12日 |
2.1.3 | 2022年9月10日 |
2.1.2 | 2022年8月2日 |
0.1.6 | 2020年5月13日 |
#374 in 文本处理
每月258次下载
在 2 crate 中使用
2.5MB
274 行
character_converter
关于
将繁体中文转换为简体中文,反之亦然。检查字符串脚本以确定字符串是繁体中文还是简体中文。
此包还包括一个最大匹配分词器。
用法
extern crate character_converter;
use character_converter::{is_traditional, is_simplified, traditional_to_simplified, simplified_to_traditional, tokenize};
let traditional_text = "歐洲";
let simplified_text = "欧洲";
// Check script
assert!(is_traditional(traditional_text));
assert!(!is_simplified(traditional_text));
// Convert script
let result_three = traditional_to_simplified(traditional_text);
assert_eq!(result_three, simplified_text);
let result_four = simplified_to_traditional(simplified_text);
assert_eq!(result_four, traditional_text);
// Tokenize
let string = "好好学习天天向上.";
let tokens = vec!["好好", "学习", "天天", "向上"];
assert_eq!(tokens, tokenize(string));
基准测试
使用夜间基准测试功能运行基准测试
cargo +nightly bench --features=bench
许可证
依赖
~2MB
~19K SLoC