#csv #stats #statistics #light-weight #input-file

app ustat

一个用于计算 XSV 文件统计信息的 (小型) 工具

2 个不稳定版本

0.2.2 2021年7月21日
0.2.1 2021年7月21日
0.2.0 2021年7月20日
0.1.0 2021年7月13日

#61 in #light-weight

MITGPL-3.0-only

17KB
348 代码行

ustat

一个用 Rust 编写的微统计程序(类似于 ministat),它可以计算一组输入文件的求和、平均值、中位数、最小值、最大值、标准差和单因素方差分析。

安装

> cargo install ustat

如果您没有 cargo,您可以使用以下方式轻松安装:

> curl https://sh.rustup.rs -sSf | sh && source $HOME/.cargo/env
Usage:
  ustat [OPTIONS] [FILE ...]

Compute statistics for the given input file(s).

Positional arguments:
  file                  The input file(s) to compute statistics for (Use stdin
                        if not specified)

Optional arguments:
  -h,--help             Show this help message and exit
  -c,--column COLUMN    The column(s) to extract data from (Default: 0 for all
                        files, runs from 0 to ...)
  -d,--delimiter DELIMITER
                        The text delimiter character to use between columns
                        (Default: ',')
  -s,--skip-header      Skip the first line of the input file (Default: False)
  --no-anova            Don't compute ANOVA for the input files (one file per
                        population) (Default: False)
  -V,--version          Show version

示例/食谱

计算 CSV 文件列 0 的基本统计信息

> cat file.csv | ustat

计算三个文件(每个 CSV 文件的列 0)的基本统计信息和 ANOVA

> ustat file_1.csv file_2.csv file_3.csv

计算 TSV 文件的基本统计信息

> ustat -d '\t' file_1.tsv

计算 file_1.csv 文件列 0 和 file_2.csv 文件列 3 的统计信息

> ustat -c 0 -c 3 file_1.csv file_2.csv

依赖项

~11MB
~189K SLoC