CUDA运行时库为CubeCL
作者:Nathaniel Simard
#377 in 科学
156 每月下载量在 cubecl 中使用
545KB 14K SLoC
运行时使用来自 cudarc 的底层原语将生成的CUDA代码编译为ptx并在运行时执行。
~27MB ~584K SLoC