37个版本

0.18.1 2024年6月8日
0.17.10 2024年2月5日
0.17.8 2023年12月20日
0.17.3 2023年11月20日
0.2.1 2021年3月5日

#2220解析器实现

Download history 1/week @ 2024-04-19 166/week @ 2024-06-07 7/week @ 2024-06-14 9/week @ 2024-07-05 103/week @ 2024-07-26 15/week @ 2024-08-02

118每月下载量

MIT/Apache

16KB
198

CSV to Arrow

Crates.io

将CSV文件转换为Apache Arrow。此包是Arrow CLI工具的一部分。

安装

下载预构建的二进制文件

您可以从https://github.com/domoritz/arrow-tools/releases获取最新版本。

使用Homebrew

brew install domoritz/homebrew-tap/csv2arrow

使用Cargo

cargo install csv2arrow

使用Cargo B(inary)Install

为了避免重新编译并加快安装速度,您可以使用cargo binstall来安装此工具

cargo binstall csv2arrow

用法

Usage: csv2arrow [OPTIONS] <CSV> [ARROW]

Arguments:
  <CSV>    Input CSV file, stdin if not present
  [ARROW]  Output file, stdout if not present

Options:
  -s, --schema-file <SCHEMA_FILE>
          File with Arrow schema in JSON format
  -m, --max-read-records <MAX_READ_RECORDS>
          The number of records to infer the schema from. All rows if not present. Setting max-read-records to zero will stop schema inference and all columns will be string typed
      --header <HEADER>
          Set whether the CSV file has headers [possible values: true, false]
  -d, --delimiter <DELIMITER>
          Set the CSV file's column delimiter as a byte character [default: ,]
  -p, --print-schema
          Print the schema to stderr
  -n, --dry
          Only print the schema
  -h, --help
          Print help
  -V, --version
          Print version

–schema-file选项使用与–dry和–print-schema相同的文件格式。

示例

有关用法示例,请参阅csv2parquet示例,它们具有类似接口。

依赖项

~13–22MB
~295K SLoC