#utf-8 #encode #decode #data-store #binary-data

nightly base_utf8

Base-UTF8编码算法的一个示例实现

1 个不稳定版本

0.1.0 2023年3月24日

#79#data-store

MIT 许可证

7KB
107

Base-UTF8

Base-UTF8是一种专门设计的编码方法,用于在仅支持UTF-8编码的环境中存储任意二进制数据。

  1. 在数据开头添加一个保留字节来存储将要添加的填充长度。
  2. 用零填充数据末尾,直到其长度是7的倍数。这是为了确保编码可以分成每7个字节为一个块。
  3. 将填充长度存储在步骤1中添加的保留字节中。
  4. 将填充后的数据分成每7个字节为一个块。
  5. 通过将原始块中每个字节的第一位存储在编码块中第一个字节的最末7位中来编码每个块。编码块中的剩余7个字节存储原始块中第一位被设置为0的字节。
  6. 输出编码后的数据。

依赖项

~285–740KB
~17K SLoC