3 个版本 (1 个稳定版)
1.0.0 | 2022年5月25日 |
---|---|
0.1.1 | 2017年5月16日 |
0.1.0 | 2017年5月15日 |
#14 in #concatenate
10KB
122 代码行
catcsv
: 将可能压缩的CSV文件目录合并
这是一个小型实用程序,我们用它将许多小CSV文件重新组合成更大的文件。在我们的例子中,这些小CSV文件是由执行map/reduce风格操作的并行度很高的Pachyderm管道生成的。
用法
catcsv - Combine many CSV files into one
Usage:
catcsv <input-file-or-dir>...
catcsv (--help | --version)
Options:
--help Show this screen.
--version Show version.
Input files must have the extension *.csv or *.csv.sz. The latter are assumed
to be in Google's "snappy framed" format: https://github.com/google/snappy
If passed a directory, this will recurse over all files in that directory.
愿望列表
如果您想添加对其他常见压缩格式的支持,例如 *.gz
,我们将乐意接受依赖于纯Rust包或包含C代码但仍然可以轻松使用musl交叉编译的包的PR。
相关工具
如果您对这个实用程序感兴趣,您可能也会对以下工具感兴趣
依赖项
~7–18MB
~221K SLoC