1 个不稳定版本
0.1.0 | 2023年10月30日 |
---|
#1751 在 文本处理
45KB
1K SLoC
cologne_phonetics
用于为 utf8 字符串生成科隆音标码的 crate。
更多信息请见 https://en.wikipedia.org/wiki/Cologne_phonetics
路线图
[ ] 支持更多 Unicode 字符
[ ] 添加更多测试/fuzzing 与定义好的语料库
lib.rs
:
科隆音标码或“科隆音标”的实现,更多信息请见 https://en.wikipedia.org/wiki/Cologne_phonetics。
此 crate 主要通过调用 utf8_to_cologne_phonetics_vec
或更推荐创建一个 CologneVec
并使用其 read_from_utf8
函数来使用。
示例
let mut buf = CologneVec::new();
buf.read_from_utf8("Marius Macher".as_bytes());
assert_eq!(buf, CologneVec::from_codes(&[
CologneCode::Class6,
CologneCode::Class7,
CologneCode::Class8,
CologneCode::Space,
CologneCode::Class6,
CologneCode::Class4,
CologneCode::Class7,
]))