11个版本 (2个稳定版)
使用旧的Rust 2015
1.1.0 | 2016年5月15日 |
---|---|
1.0.0 | 2015年11月16日 |
0.0.9 | 2015年5月10日 |
0.0.8 | 2015年3月7日 |
0.0.4 | 2014年12月26日 |
#679 in 文本处理
953,942 每月下载量
在 2,151 个Crate中(32个直接使用) 使用
21KB
230 行
Rust的CESU-8编码器/解码器
文档.
在普通UTF-8和CESU-8编码之间转换。
CESU-8将基本多语言平面之外的字符编码为两个UTF-16代理字符,然后将这些字符进一步重新编码为无效的、3字节的UTF-8字符。这意味着4字节的UTF-8序列成为6字节的CESU-8序列。
请注意,CESU-8仅适用于紧密耦合系统内部使用,而不适用于数据交换。
在处理Java、Oracle或MySQL,以及尝试在补充多语言平面或补充汉字平面上存储表情符号、象形文字或其他字符时,有时需要这种编码。
许可证
此代码中的一些部分是从Rust的src/libcore/str.rs
文件改编的。此代码受LICENSE-RUST.txt的约束,并归The Rust Project开发者及个人Rust贡献者所有,如该文件所述。
本项目中的新代码也以相同条款分发。