5 个不稳定版本
0.3.0 | 2022 年 3 月 14 日 |
---|---|
0.2.2 | 2022 年 2 月 22 日 |
0.2.1 | 2022 年 1 月 13 日 |
0.2.0 | 2022 年 1 月 11 日 |
0.1.0 | 2021 年 12 月 30 日 |
#3 in #random-forest
每月 30 次下载
用于 changeforest
45KB
991 行
Biosphere
简单,快速随机森林。
具有运行时间 O(n d log(n) + n_estimators d n max_depth)
的随机森林,而不是 O(n_estimators mtry n log(n) max_depth)
。
biosphere
可作为 Rust 包和 Python 包使用。
基准测试
在 M1 Pro 上运行,使用 n_jobs=4
。将包含 OOB 分数的 400 树的随机森林拟合到 纽约出租车数据集,10 次运行中的最小值。经过特征工程后,数据集由 5 个数值特征和 7 个独热编码特征组成。
模型 | 1000 | 2000 | 4000 | 8000 | 16000 | 32000 | 64000 | 128000 | 256000 | 512000 | 1024000 | 2048000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
biosphere | 0.04s | 0.08s | 0.15s | 0.32s | 0.65s | 1.40s | 2.97s | 6.48s | 15.53s | 37.91s | 96.69s | 231.82s |
scikit-learn | 0.28s | 0.34s | 0.46s | 0.69s | 1.23s | 2.47s | 4.99s | 10.49s | 22.11s | 51.04s | 118.95s | 271.03s |
依赖项
~3MB
~57K SLoC