#parquet #viewing #egui #built #metadata #query #format

app parqbench

基于 egui 构建的查看 parquet 文件的实用工具

4 个版本

0.2.0 2022 年 9 月 25 日
0.1.2 2022 年 9 月 24 日
0.1.1 2022 年 9 月 24 日
0.1.0 2022 年 9 月 23 日

#15 in #viewing

GPL-3.0-or-later

33KB
701 行代码(不包括注释)

ParqBench

一个简单、跨平台的查看 parquet 文件的实用工具,基于 egui 和 arrow 构建。

待办事项列表

  • 构建/发布的 CI
  • 加载分区数据集
  • 选项卡布局/树形结构
  • 向侧边栏添加控件和元数据
  • 解析 pandas 格式元数据
  • 使用钩子打开(命令行参数)
  • 错误通知
  • 支持 datafusion 支持的所有文件类型
  • 更新 datafusion 和 egui/eframe
  • 自动调整列大小
  • 重新审视 &str 与 String 的使用
  • 基本查询操作的 UI
  • 查询窗格中的源配置
  • 使用 parquet crate 的丰富元数据

安装

发布 上提供适用于 Windows 和 Linux 的通用、便携式二进制文件。

ParqBench 在 Linux(Manjaro 22.0,内核 5.15.60)和 Windows 10(21H2)上进行了测试。版本是用以下命令构建的:

cargo build --release --target x86_64-pc-windows-gnu cargo build --release --target x86_64-unknown-linux-gnu

这些构建是自包含的、便携的、可执行文件。生成的二进制文件放置在 target/<target>

依赖项

~51–87MB
~1.5M SLoC