1个稳定版本
2.0.0 | 2019年11月23日 |
---|
#2303 在 算法
1,328 每月下载量
用于 3 个crate(2个直接使用)
15KB
287 行
sacapart
计算后缀数组(文本所有后缀的字典序)代价高昂,尤其是文本很大时。
对于非常大的输入,有时可以进行妥协。我们不是计算整个文本的后缀数组,而是计算前半部分的后缀数组,以及后半部分的后缀数组。
内存使用量基本保持不变(取决于使用的SACA),查找时间因一个常数因子变差(分区数),并且,在分区边界上,有时会发现更短(更差)的匹配项。
对于某些应用,如比较非常大的文件,这种妥协是有意义的。阅读文档和测试以确定sacapart
是否适合您。
注意:sacapart
旨在与支持sacabase
的SACA一起使用,如divsufsort
。
依赖关系
~1.5MB
~28K SLoC