5 个不稳定版本

0.3.0 2022 年 3 月 14 日
0.2.2 2022 年 2 月 22 日
0.2.1 2022 年 1 月 13 日
0.2.0 2022 年 1 月 11 日
0.1.0 2021 年 12 月 30 日

#3 in #random-forest

每月 30 次下载
用于 changeforest

BSD-3-Clause

45KB
991

Biosphere

简单,快速随机森林。

具有运行时间 O(n d log(n) + n_estimators d n max_depth) 的随机森林,而不是 O(n_estimators mtry n log(n) max_depth)

biosphere 可作为 Rust 包和 Python 包使用。

基准测试

在 M1 Pro 上运行,使用 n_jobs=4。将包含 OOB 分数的 400 树的随机森林拟合到 纽约出租车数据集,10 次运行中的最小值。经过特征工程后,数据集由 5 个数值特征和 7 个独热编码特征组成。

模型 1000 2000 4000 8000 16000 32000 64000 128000 256000 512000 1024000 2048000
biosphere 0.04s 0.08s 0.15s 0.32s 0.65s 1.40s 2.97s 6.48s 15.53s 37.91s 96.69s 231.82s
scikit-learn 0.28s 0.34s 0.46s 0.69s 1.23s 2.47s 4.99s 10.49s 22.11s 51.04s 118.95s 271.03s

依赖项

~3MB
~57K SLoC