0.1.3 |
|
---|---|
0.1.2 |
|
0.1.1 |
|
0.1.0 |
|
#35 在 #mean
9KB
184 行
Sqsh Testdata Generator
一个生成合成浮点数据集的工具。目前只支持具有高斯/正态分布的数据集。如果需要,可以添加更多的分布。
安装
使用稳定的 cargo
发布版安装工具集
cargo install sqsh-testdata
使用github上的最新版本
git clone https://github.com/sqsh-project/testdata.git && \
cd sqsh-testdata && \
cargo install --path .
用法
生成数据集的最简单方法是使用 mean
、standard deviation
和要生成的数字数量通过 num
sqsh-testdata --mean 10 --std 2 --size 1000 # mandatory arguments
默认生成单精度浮点数据。可以使用 --datatype
参数进行更改
sqsh-testdata --mean 10 --std 2 --size 1000 --datatype double
如果需要定义不同于机器本机的不同字节序,可以使用 --endianess
参数
sqsh-testdata --mean 10 --std 2 --size 1000 --endianess little
通过提供一个 --seed
值,可以在不同的环境中重现生成数据
sqsh-testdata --mean 10 --std 2 --size 1000 --seed 42
可以将数据输出到文件,通过将结果管道传输到文件
sqsh-testdata --mean 10 --std 2 --size 1000 > /tmp/data.raw # save to file
有关更多信息,请使用帮助菜单: td --help
依赖项
~5.5MB
~97K SLoC