#suffix #search #index #saca

sacapart

分割后缀数组,用于与sacabase一起使用

1个稳定版本

2.0.0 2019年11月23日

#2303算法

Download history 88/week @ 2024-03-30 126/week @ 2024-04-06 87/week @ 2024-04-13 152/week @ 2024-04-20 353/week @ 2024-04-27 251/week @ 2024-05-04 386/week @ 2024-05-11 422/week @ 2024-05-18 197/week @ 2024-05-25 481/week @ 2024-06-01 396/week @ 2024-06-08 287/week @ 2024-06-15 290/week @ 2024-06-22 370/week @ 2024-06-29 284/week @ 2024-07-06 352/week @ 2024-07-13

1,328 每月下载量
用于 3 个crate(2个直接使用)

MIT 许可协议

15KB
287

sacapart

计算后缀数组(文本所有后缀的字典序)代价高昂,尤其是文本很大时。

对于非常大的输入,有时可以进行妥协。我们不是计算整个文本的后缀数组,而是计算前半部分的后缀数组,以及后半部分的后缀数组。

内存使用量基本保持不变(取决于使用的SACA),查找时间因一个常数因子变差(分区数),并且,在分区边界上,有时会发现更短(更差)的匹配项。

对于某些应用,如比较非常大的文件,这种妥协是有意义的。阅读文档和测试以确定sacapart是否适合您。

注意:sacapart旨在与支持sacabase的SACA一起使用,如divsufsort

依赖关系

~1.5MB
~28K SLoC