3 个版本 (稳定)
1.1.0 | 2021年12月30日 |
---|---|
1.0.0 | 2021年4月28日 |
0.0.0 | 2021年4月28日 |
#1132 in 文本处理
63KB
1.5K SLoC
wtf8-rs
WTF-8 编码 的实现。
WTF-8 是一个旨在在自包含系统中内部使用的黑客,这些系统需要支持由于遗留原因可能格式错误的 UTF-16。
任何 WTF-8 数据在输出之前必须转换为系统边界的 Unicode 编码。建议使用 UTF-8。WTF-8 不应用于表示文件格式中的文本或通过互联网传输。
特别是,编码标准 [ENCODING] 定义了 UTF-8 和其他用于网络的编码。WTF-8 没有也不会有任何编码标签 [ENCODING] 或 IANA 字符集别名 [CHARSETS]。
库
依赖于标准库的 alloc
crate,但不依赖于 std
。
Wtf8
和Wtf8Buf
- 类似于str
和String
,提供类型安全的 WTF-8 字符串。CodePoint
- 类似于char
,提供类型安全的 Unicode 代码点。- 从可能格式错误的 UTF-16 无损转换为
CodePoint
迭代器,并从CodePoint
迭代器转换为Wtf8Buf
,以及从str
转换为Wtf8
。 - 从
Wtf8
转换为String
,可能是有损的。
许可证
许可方式为以下之一
- Apache 许可证 2.0 版 (LICENSE-APACHE 或 https://apache.ac.cn/licenses/LICENSE-2.0)
- MIT 许可证 (LICENSE-MIT 或 https://open-source.org.cn/licenses/MIT)
任选其一。
贡献
除非你明确声明,否则任何旨在包含在作品中的贡献,根据 Apache-2.0 许可证的定义,应双许可如上所述,不附加任何额外条款或条件。