#simd #avx2 #sse #algorithm #is-sorted

no-std sorted-rs

通过SIMD实现的一种快速算法,用于检查序列是否已排序

1 个不稳定版本

0.1.0 2023年5月26日

#1447硬件支持

Apache-2.0/MIT

19KB
423 代码行

build

另一种基于SIMD的算法,用于检查切片是否已排序

它同时支持 SSE2AVX2,比常规实现快得多。

泛型

 [ a, b, c, d .... x, y, z]
 compare a and b,
 compare b and c,
 compare c and d

SIMD

 [ a, b, c, d .... x, y, z]
 load [a, b, c, d] into chunk0,
 load [b, c, d, d] into chunk1,
 compare chunk0 and chunk1,
 load [d, e, f, g] into chunk0,
 load [e, f, g, g] into chunk1,
 compare chunk0 and chunk1 again

在AMD上的基准测试

大小 泛型 sse avx2
4 7.4974 ns 8.3876 ns 1.1984 ns
32 65.302 ns 40.632 ns 16.469 ns
64 121.92 ns 71.861 ns 30.551 ns
128 237.09 ns 144.08 ns 66.191 ns
256 466.77 ns 273.48 ns 99.640 ns
1024 1.8486 µs 1.0634 µs 410.66 ns
4096 7.3648 µs 4.2080 µs 6.1038 µs
16384 29.458 µs 16.702 µs 6.1038 µs
65536 117.82 µs 66.982 µs 24.355 µs

依赖项

~510KB
~10K SLoC