8个版本
0.3.2 | 2019年6月12日 |
---|---|
0.3.1 | 2019年6月8日 |
0.2.0 | 2019年6月6日 |
0.1.3 | 2019年6月6日 |
0.1.1 | 2019年5月28日 |
#1606 in 数学
每月 28 下载
58KB
2K SLoC
blasoxide
BLAS在Rust中的实现
架构
仅使用针对特定平台编写的代码优化了Level1函数和微内核。
使用rayon并行化Level3函数。
支持的CPU
这些CPU针对它们进行了优化实现
- 支持fma的x86_64 CPU
贡献
任何人都可以根据个人意愿进行贡献。只需在提交前运行 cargo clippy
和 cargo fmt
即可
灵感
架构和算法大量受到以下启发:
依赖
~1.5MB
~25K SLoC