5 个版本 (破坏性)

0.12.0 2024 年 2 月 7 日
0.11.0 2023 年 2 月 28 日
0.10.0 2022 年 11 月 21 日
0.9.0 2022 年 10 月 26 日
0.7.0 2022 年 5 月 16 日

#2283 in 数据库接口

每月 34 次下载

Apache-2.0

89KB
1.5K SLoC

Ballista 命令行界面

Ballista 是一个用 Rust 编写的分布式查询执行框架,它使用 Apache Arrow 作为其内存格式。

Ballista CLI 允许通过进程内 DataFusion 上下文或分布式 Ballista 上下文执行 SQL 查询。

USAGE:
    ballista-cli [FLAGS] [OPTIONS]

FLAGS:
    -h, --help       Prints help information
    -q, --quiet      Reduce printing other than the results and work quietly
    -V, --version    Prints version information

OPTIONS:
    -c, --batch-size <batch-size>    The batch size of each query, or use DataFusion default
    -p, --data-path <data-path>      Path to your data, default to current directory
    -f, --file <file>...             Execute commands from file(s), then exit
        --format <format>            Output format [default: table]  [possible values: csv, tsv, table, json, ndjson]
        --host <host>                Ballista scheduler host
        --port <port>                Ballista scheduler port

示例

创建一个要查询的 CSV 文件。

$ echo "1,2" > data.csv
$ ballista-cli

Ballista CLI v0.6.0

> CREATE EXTERNAL TABLE foo (a INT, b INT) STORED AS CSV LOCATION 'data.csv';
0 rows in set. Query took 0.001 seconds.

> SELECT * FROM foo;
+---+---+
| a | b |
+---+---+
| 1 | 2 |
+---+---+
1 row in set. Query took 0.017 seconds.

Ballista-Cli

如果您想通过 ballista-cli 在 ballista 中执行 SQL,则必须首先构建/编译 ballista-cli

cd arrow-ballista/ballista-cli
cargo build

Ballista CLI 可以连接到 Ballista 调度器以执行查询。

ballista-cli --host localhost --port 50050

依赖关系

~87MB
~1.5M SLoC