simt 的一部分。 rocBLAS API 绑定
由 Mack Straight 编写
在 图形API 中排名第711
1MB 28K SLoC
这是一个早期版本,但正在全力开发中。
一个极其简单的SIMT风格(CUDA、HIP、计算着色器)计算接口。
目前的重点是CUDA + ROCm/HIP支持。
内核用C++编写,这使得移植现有代码变得容易,同时也减少了处理NVVM/AMDGPU代码的许多烦恼。
~0–5MB