#generate #dataset #data #mean #distribution #datatype

已删除 sqsh-testdata

生成数据压缩测试数据的工具

0.1.3 2022年8月19日
0.1.2 2022年8月2日
0.1.1 2022年8月2日
0.1.0 2022年7月31日

#35#mean

MIT/Apache

9KB
184

Sqsh Testdata Generator

一个生成合成浮点数据集的工具。目前只支持具有高斯/正态分布的数据集。如果需要,可以添加更多的分布。

安装

使用稳定的 cargo 发布版安装工具集

cargo install sqsh-testdata

使用github上的最新版本

git clone https://github.com/sqsh-project/testdata.git && \
cd sqsh-testdata && \
cargo install --path .

用法

生成数据集的最简单方法是使用 meanstandard deviation 和要生成的数字数量通过 num

sqsh-testdata --mean 10 --std 2 --size 1000 # mandatory arguments

默认生成单精度浮点数据。可以使用 --datatype 参数进行更改

sqsh-testdata --mean 10 --std 2 --size 1000 --datatype double

如果需要定义不同于机器本机的不同字节序,可以使用 --endianess 参数

sqsh-testdata --mean 10 --std 2 --size 1000 --endianess little

通过提供一个 --seed 值,可以在不同的环境中重现生成数据

sqsh-testdata --mean 10 --std 2 --size 1000 --seed 42

可以将数据输出到文件,通过将结果管道传输到文件

sqsh-testdata --mean 10 --std 2 --size 1000 > /tmp/data.raw  # save to file

有关更多信息,请使用帮助菜单: td --help

依赖项

~5.5MB
~97K SLoC