8 个版本

0.0.8 2020 年 12 月 29 日
0.0.7 2020 年 7 月 9 日
0.0.2 2020 年 6 月 13 日
0.0.1 2018 年 11 月 28 日

#1990命令行工具

每月 46 次下载

Unlicense/MIT 许可

13KB
280 代码行

automat

是什么?

它是一个用于在命令行上进行初步探索性数据分析的工具。它旨在与其他所有优秀工具一起使用。

具体来说,automat 提供以下功能来帮助您处理数据:

  • 过滤(可以过滤数值)
  • 转换
  • 汇总
  • 排列
  • 按组分组
  • 对表格数据执行其他类似 SQL 的操作

为什么?

使用方法

所有示例和基准测试中使用的 csv 是来自 数据科学工具包 的 worldcitiespop 数据集。

过滤

简单过滤

atm worldcitiespop.csv filter"Population<1000000"

多个过滤命令可以链接在一起

atm worldcitiespop.csv filter"Population<1000000"|atm filter"Longitude<-50"

atm 尽力成为一个好的 Unix 用户。例如,与其他命令行工具(如 xsv)一起使用。

atm worldcitiespop.csv filter"Population<20"|atm filter"Population>=10"|atm filter"Longitude<-50"|xsv select City,Population|xsv table

设置

如果您在系统上安装了 rustup,则可以简单地运行 cargo install automat

您也可以通过 docker 运行它。

例如,如果您在本地目录中有一个名为 worldcitiespop.csv 的 csv 文件

docker run--rm-v$(PWD):/data oembot/automat./atm/data/worldcitiespop.csv filter"Population<10"

基准测试

基准测试是用 hyperfine 创建的。

v.0.0.5

命令 平均值 [s] 最小值 [s] 最大值 [s] 相对
目标/发布/atm test.csv filter"Population<1000000" 1.352 ± 0.009 1.341 1.366 1.00

v0.0.4

命令 平均值 [s] 最小值 [s] 最大值 [s] 相对
目标/发布/atm test.csv filter"Population<1000000" 1.360 ± 0.010 1.346 1.379 1.00

依赖关系

~7.5MB
~123K SLoC