2个版本
0.1.4 | 2022年9月6日 |
---|---|
0.1.3 | 2022年9月1日 |
#601 in 测试
9KB
184 行
datapool
用于生成合成浮点数据集的工具。目前仅支持具有高斯/正态分布的数据集。如有需要,可以添加更多分布。
安装
使用稳定的cargo
版本安装工具集
cargo install datapool
使用GitHub上的最新版本
git clone https://github.com/sqsh-project/datapool.git && \
cd datapool && \
cargo install --path .
用法
生成数据集的最简单方法是通过指定mean
、standard deviation
和要生成的数字数量num
datapool --mean 10 --std 2 --size 1000 # mandatory arguments
默认情况下,生成单精度浮点数据。这可以通过使用--datatype
参数来更改
datapool --mean 10 --std 2 --size 1000 --datatype double
如果需要定义与机器原生不同的端序,可以使用--endianess
参数
datapool --mean 10 --std 2 --size 1000 --endianess little
通过提供--seed
值,可以生成在多个环境中可重现的数据
datapool --mean 10 --std 2 --size 1000 --seed 42
可以将数据输出到文件,通过将结果重定向到文件
datapool --mean 10 --std 2 --size 1000 > /tmp/data.raw # save to file
有关更多信息,请使用帮助菜单:datapool --help
依赖项
~5MB
~96K SLoC