#statistics #stats #standard-deviation #data #floating-point

rolling-stats

基于 Welford 的在线算法,对任意浮点数进行滚动统计计算(最小值/最大值/平均值/标准差)

10 个版本 (6 个破坏性更新)

0.7.0 2023 年 6 月 4 日
0.5.1 2023 年 1 月 14 日
0.5.0 2021 年 11 月 10 日
0.4.0 2021 年 2 月 10 日
0.1.0 2019 年 2 月 13 日

#123 in 科学

Download history 141/week @ 2024-04-20 172/week @ 2024-04-27 125/week @ 2024-05-04 259/week @ 2024-05-11 150/week @ 2024-05-18 172/week @ 2024-05-25 109/week @ 2024-06-01 126/week @ 2024-06-08 173/week @ 2024-06-15 219/week @ 2024-06-22 132/week @ 2024-06-29 136/week @ 2024-07-06 201/week @ 2024-07-13 167/week @ 2024-07-20 217/week @ 2024-07-27 142/week @ 2024-08-03

744 每月下载量
4 个库中使用 (2 个直接使用)

MIT/Apache

22KB
251

Rust-Rolling-Stats

rolling-stats 库提供了对任意浮点数进行滚动统计计算(最小值、最大值、平均值、标准差)的功能。它使用 Welford 的在线算法进行这些计算。此包与 no_std 兼容。

有关算法的更多信息,请访问维基百科上的 计算方差的算法

状态

GitHub tag Build Status Crates.io Docs.rs

用法

单线程示例

以下是在单线程环境中使用 rust-rolling-stats 的示例

use rolling_stats::Stats;
use rand_distr::{Distribution, Normal};
use rand::SeedableRng;

type T = f64;

const MEAN: T = 0.0;
const STD_DEV: T = 1.0;
const NUM_SAMPLES: usize = 10_000;
const SEED: u64 = 42;

let mut stats: Stats<T> = Stats::new();
let mut rng = rand::rngs::StdRng::seed_from_u64(SEED); // Seed the RNG for reproducibility
let normal = Normal::<T>::new(MEAN, STD_DEV).unwrap();

// Generate random data
let random_data: Vec<T> = (0..NUM_SAMPLES).map(|_x| normal.sample(&mut rng)).collect();

// Update the stats one by one
random_data.iter().for_each(|v| stats.update(*v));

// Print the stats
println!("{}", stats);
// Output: (avg: 0.00, std_dev: 1.00, min: -3.53, max: 4.11, count: 10000)

多线程示例

此示例展示了在 rust-rolling-stats 的帮助下,在多线程环境中使用的情况

use rolling_stats::Stats;
use rand_distr::{Distribution, Normal};
use rand::SeedableRng;
use rayon::prelude::*;

type T = f64;

const MEAN: T = 0.0;
const STD_DEV: T = 1.0;
const NUM_SAMPLES: usize = 500_000;
const SEED: u64 = 42;
const CHUNK_SIZE: usize = 1000;

let mut stats: Stats<T> = Stats::new();
let mut rng = rand::rngs::StdRng::seed_from_u64(SEED); // Seed the RNG for reproducibility
let normal = Normal::<T>::new(MEAN, STD_DEV).unwrap();

// Generate random data
let random_data: Vec<T> = (0..NUM_SAMPLES).map(|_x| normal.sample(&mut rng)).collect();

// Update the stats in parallel. New stats objects are created for each chunk of data.
let stats: Vec<Stats<T>> = random_data
    .par_chunks(CHUNK_SIZE) // Multi-threaded parallelization via Rayon
    .map(|chunk| {
        let mut s: Stats<T> = Stats::new();
        chunk.iter().for_each(|v| s.update(*v));
        s
    })
    .collect();

// Check if there's more than one stat object
assert!(stats.len() > 1);

// Accumulate the stats using the reduce method
let merged_stats = stats.into_iter().reduce(|acc, s| acc.merge(&s)).unwrap();

// Print the stats
println!("{}", merged_stats);
// Output: (avg: -0.00, std_dev: 1.00, min: -4.53, max: 4.57, count: 500000)

特性标志

以下特性标志可用

  • serde:通过 serde 包启用对 Stats 结构的序列化和反序列化。

许可证

rolling-stats 库采用 MIT 和 Apache 许可证 2.0 双许可。通过提交拉取请求,您隐式同意这些许可条款。

依赖关系

~475–730KB
~15K SLoC