#bag #hamming #words #bow #lsh #array

无 std hamming-bow

为 hamming-space 词汇袋生成二进制词频位数组

1 个不稳定版本

0.1.0 2021 年 7 月 21 日

6#lsh

MIT 许可证

7KB
57

hamming-bow

Discord Crates.io MIT/Apache docs.rs LoC Tests Lints no_std

为 hamming-space 词汇袋生成二进制词频位数组

工作原理

通过使用 hamming-dict 在 hamming 空间中创建尽可能分散的码字。

对于每个输入键,在字典中找到其最近邻,并在袋中设置相应的位。如果袋中设置的位足够多,将增加设置位的阈值单词出现次数,以平衡哈希。

依赖项

~340–590KB
~11K SLoC