2个版本

0.1.4 2022年9月6日
0.1.3 2022年9月1日

#601 in 测试

MIT/Apache

9KB
184

datapool

用于生成合成浮点数据集的工具。目前仅支持具有高斯/正态分布的数据集。如有需要,可以添加更多分布。

安装

使用稳定的cargo版本安装工具集

cargo install datapool

使用GitHub上的最新版本

git clone https://github.com/sqsh-project/datapool.git && \
cd datapool && \
cargo install --path .

用法

生成数据集的最简单方法是通过指定meanstandard deviation和要生成的数字数量num

datapool --mean 10 --std 2 --size 1000 # mandatory arguments

默认情况下,生成单精度浮点数据。这可以通过使用--datatype参数来更改

datapool --mean 10 --std 2 --size 1000 --datatype double

如果需要定义与机器原生不同的端序,可以使用--endianess参数

datapool --mean 10 --std 2 --size 1000 --endianess little

通过提供--seed值,可以生成在多个环境中可重现的数据

datapool --mean 10 --std 2 --size 1000 --seed 42

可以将数据输出到文件,通过将结果重定向到文件

datapool --mean 10 --std 2 --size 1000 > /tmp/data.raw  # save to file

有关更多信息,请使用帮助菜单:datapool --help

依赖项

~5MB
~96K SLoC