4 个版本 (2 个重大更改)
0.3.0 | 2022年7月30日 |
---|---|
0.2.0 | 2022年7月28日 |
0.1.1 | 2022年7月20日 |
0.1.0 | 2022年7月19日 |
#1564 在 编码
每月下载量 1,358
在 2 crate 中使用
62KB
1.5K SLoC
使用 Rust 读取 Apache ORC
使用 Rust 读取 Apache ORC。
此仓库类似于 parquet2 和 Avro-schema,提供了一套工具来
- 读取 ORC 文件(proto 结构)
- 读取 stripes(将 proto 元数据转换为内存区域的过程)
- 解码 stripes(解码 stripes 为例如布尔值、RLE 运行等的过程)
目前支持以下(逻辑)类型
- 布尔值
- 字符串
- 整数
- 浮点数
尚未实现的内容
- Snappy、LZO 解压缩
- RLE v2
Patched Base
解码 - RLE v1 解码
- 解码非原生逻辑类型的实用函数
- 十进制
- 时间戳
- 结构
- 列表
- 联合
运行测试
python3 -m venv venv
venv/bin/pip install -U pip
venv/bin/pip install -U pyorc
venv/bin/python write.py
cargo test
依赖项
~2.5MB
~57K SLoC