#blas #simd #science #kernel

blasoxide

BLAS在Rust中的实现

8个版本

0.3.2 2019年6月12日
0.3.1 2019年6月8日
0.2.0 2019年6月6日
0.1.3 2019年6月6日
0.1.1 2019年5月28日

#1606 in 数学

每月 28 下载

MIT许可证

58KB
2K SLoC

blasoxide

Released API docs Build Status

BLAS在Rust中的实现

架构

仅使用针对特定平台编写的代码优化了Level1函数和微内核。

使用rayon并行化Level3函数。

支持的CPU

这些CPU针对它们进行了优化实现

  • 支持fma的x86_64 CPU

贡献

任何人都可以根据个人意愿进行贡献。只需在提交前运行 cargo clippycargo fmt 即可

灵感

架构和算法大量受到以下启发:

依赖

~1.5MB
~25K SLoC