37个版本
0.18.1 | 2024年6月8日 |
---|---|
0.17.10 | 2024年2月5日 |
0.17.8 | 2023年12月20日 |
0.17.3 | 2023年11月20日 |
0.2.1 | 2021年3月5日 |
#2220在解析器实现中
118每月下载量
16KB
198 行
CSV to Arrow
将CSV文件转换为Apache Arrow。此包是Arrow CLI工具的一部分。
安装
下载预构建的二进制文件
您可以从https://github.com/domoritz/arrow-tools/releases获取最新版本。
使用Homebrew
brew install domoritz/homebrew-tap/csv2arrow
使用Cargo
cargo install csv2arrow
使用Cargo B(inary)Install
为了避免重新编译并加快安装速度,您可以使用cargo binstall
来安装此工具
cargo binstall csv2arrow
用法
Usage: csv2arrow [OPTIONS] <CSV> [ARROW]
Arguments:
<CSV> Input CSV file, stdin if not present
[ARROW] Output file, stdout if not present
Options:
-s, --schema-file <SCHEMA_FILE>
File with Arrow schema in JSON format
-m, --max-read-records <MAX_READ_RECORDS>
The number of records to infer the schema from. All rows if not present. Setting max-read-records to zero will stop schema inference and all columns will be string typed
--header <HEADER>
Set whether the CSV file has headers [possible values: true, false]
-d, --delimiter <DELIMITER>
Set the CSV file's column delimiter as a byte character [default: ,]
-p, --print-schema
Print the schema to stderr
-n, --dry
Only print the schema
-h, --help
Print help
-V, --version
Print version
–schema-file选项使用与–dry和–print-schema相同的文件格式。
示例
有关用法示例,请参阅csv2parquet
示例,它们具有类似接口。
依赖项
~13–22MB
~295K SLoC