#401 在数据结构中排名

每月下载 355 次
在物化视图中使用

Apache-2.0 OR MIT

135KB
2.5K SLoC

indexset

一个纯 Rust 动态有序统计 b-tree。

该软件包实现了一种紧凑的集合数据结构，它保留其元素的排序顺序，并允许通过值或排序顺序位置查找条目。

此外，它（在大多数情况下）是 stdlib BTree 的直接替换品。

背景

该项目受到了 indexmap 和 python 的 sortedcontainers 的强烈启发。

与两者不同的是

indexmap 是一个提供数值查找的哈希表，但在删除的情况下不会保持顺序，而 indexset 是一个始终保持顺序的 BTree，无论执行哪种突变操作。
sortecontainers 在精神上类似，但使用不同的算法来平衡树，并且依赖于堆进行数值查找。

indexset 提供以下功能

BTreeSet 和 BTreeMap 从其构建方式直接推导出一些性能事实，大致为

一个二级 B-Tree，其中使用 Fenwick 树作为数值查找的低成本索引

运行 cargo bench 并自行查看。

在一台最低配置的 M1 Macbook Pro 上，我得到了以下数据

是的。

获取第i个元素比stdlib的btree快3400倍，contains快10%，迭代快两倍，但插入速度减半。

如果你的使用场景是std::collections::BTreeSet和BTreeMap更侧重于读取，或者你确实需要按排序顺序位置索引，那么检查这个indexset可能是有价值的。

这个库叫做indexset，因为基本数据结构是BTreeSet。BTreeMap是一个具有Pair<K, V>项类型的BTreeSet。

~0.4–1MB
~22K SLoC