适用于 f32 和 f64 矩阵的一般矩阵乘法。在具有通用布局的矩阵上操作(它们可以使用任意的行和列步长)。检测并使用 x86 上的 AVX 或 SSE2…
bluss 的 matrixmultiply crate 的多线程分支。Rust 中 f32 和 f64 矩阵的一般矩阵乘法。支持具有通用步长的矩阵。使用微内核策略…