3 个版本 (稳定)

1.1.0 2021年12月30日
1.0.0 2021年4月28日
0.0.0 2021年4月28日

#1132 in 文本处理

MIT/Apache

63KB
1.5K SLoC

wtf8-rs

WTF-8 编码 的实现。

crates.io docs.rs

WTF-8 是一个旨在在自包含系统中内部使用的黑客,这些系统需要支持由于遗留原因可能格式错误的 UTF-16。

任何 WTF-8 数据在输出之前必须转换为系统边界的 Unicode 编码。建议使用 UTF-8。WTF-8 不应用于表示文件格式中的文本或通过互联网传输。

特别是,编码标准 [ENCODING] 定义了 UTF-8 和其他用于网络的编码。WTF-8 没有也不会有任何编码标签 [ENCODING] 或 IANA 字符集别名 [CHARSETS]。

https://simonsapin.github.io/wtf-8/#intended-audience

依赖于标准库的 alloc crate,但不依赖于 std

  • Wtf8Wtf8Buf - 类似于 strString,提供类型安全的 WTF-8 字符串。
  • CodePoint - 类似于 char,提供类型安全的 Unicode 代码点。
  • 从可能格式错误的 UTF-16 无损转换为 CodePoint 迭代器,并从 CodePoint 迭代器转换为 Wtf8Buf,以及从 str 转换为 Wtf8
  • Wtf8 转换为 String,可能是有损的。

许可证

许可方式为以下之一

任选其一。

贡献

除非你明确声明,否则任何旨在包含在作品中的贡献,根据 Apache-2.0 许可证的定义,应双许可如上所述,不附加任何额外条款或条件。

无运行时依赖