2个不稳定版本

0.2.0 2021年12月5日
0.1.0 2021年11月22日

#37#executing

Download history 289/week @ 2024-03-13 350/week @ 2024-03-20 455/week @ 2024-03-27 505/week @ 2024-04-03 357/week @ 2024-04-10 439/week @ 2024-04-17 339/week @ 2024-04-24 355/week @ 2024-05-01 173/week @ 2024-05-08 214/week @ 2024-05-15 147/week @ 2024-05-22 216/week @ 2024-05-29 194/week @ 2024-06-05 213/week @ 2024-06-12 207/week @ 2024-06-19 212/week @ 2024-06-26

859 每月下载次数
7 个crate中使用 (通过 cuda_std)

MIT/Apache

10KB
176

Rust CUDA项目

一个用于编写和执行极快GPU代码的库和工具生态系统,完全使用 Rust 编写。

指南 | 入门 | 特性

⚠️ 该项目仍处于早期开发阶段,请期待错误、安全问题以及无法正常工作的功能 ⚠️

目标

Rust CUDA项目是一个旨在使Rust通过CUDA工具包成为极快GPU计算的一级语言的项目的项目。它提供了将Rust编译成极快的PTX代码的工具,以及用于与现有CUDA库一起使用的库。

背景

历史上,通用高性能GPU计算一直是使用CUDA工具包完成的。CUDA工具包主要提供了一种方法,可以在单个源文件中使用Fortran/C/C++代码与CPU代码协同工作进行GPU计算。它还提供了许多库、工具、论坛和文档,以补充单源CPU/GPU代码。

CUDA是仅限于NVIDIA的工具包。已经提出了许多用于跨平台GPU计算的工具,例如OpenCL、Vulkan Computing和HIP。然而,CUDA仍然是此类任务中使用最广泛的工具包。这就是为什么必须使Rust成为与CUDA工具包一起使用的可行选项至关重要。

然而,CUDA与Rust的结合在历史上一直非常坎坷。直到现在,唯一可行的选择是使用LLVM PTX后端,但是LLVM PTX后端并不总是正常工作,并且会为许多常见的Rust操作生成无效的PTX,而且近年来,随着rust-gpu(Rust -> SPIR-V)等项目的出现,已经反复证明需要一个针对GPU上Rust的专用解决方案。

我们的希望是通过这个项目,我们可以推动 Rust GPU 计算行业的发展,并使 Rust 成为此类任务的优秀语言。Rust 提供了许多好处,例如为每个内核带来的 __restrict__ 性能优势,出色的模块/库系统,使用 unsafe 标记 CPU/GPU 代码中的不安全区域,以及高级封装到低级 CUDA 库等。

结构

Rust CUDA 项目的范围非常广泛,它涵盖了整个 CUDA 生态系统,并提供了使用 Rust 进行使用的库和工具。因此,项目包含了许多针对 CUDA 生态系统各个方面的 crate。

当前的库列表如下

  • rustc_codegen_nvvm,这是一个针对 NVVM IR(LLVM IR 的一个子集)的 rustc 后端,用于 libnvvm 库。
    • 生成高度优化的 PTX 代码,可以被 CUDA 驱动 API 加载并在 GPU 上执行。
    • 在不久的将来它将仅支持 CUDA,但将来可能用于 amdgpu。
  • cuda_std 用于 GPU 端函数和实用工具,例如线程索引查询、内存分配、warp 内置函数等。
    • 不是 低级库,提供许多实用函数,使编写更干净、更可靠的 GPU 内核更容易。
    • rustc_codegen_nvvm 密切相关,通过它内部公开 GPU 功能。
  • cust 用于 CPU 端 CUDA 功能,例如启动 GPU 内核、GPU 内存分配、设备查询等。
    • 高级库,具有 RAII 和 Rust Results 等功能,使得管理 GPU 接口更容易、更干净。
    • CUDA 驱动 API 的高级封装,是 C++ 中更常用的 CUDA Runtime API 的低级版本。
    • 比 C++ Runtime API 提供更细粒度的控制,例如内核并发和模块加载。
  • gpu_rand 用于 GPU 友好的随机数生成,目前仅实现了来自 rand_xoshiro 的 xoroshiro RNG。
  • optix 用于 CPU 端硬件光线追踪和去噪,使用 CUDA OptiX 库。

还包括许多“胶水”crate,用于某些较小的 CUDA 库的高级封装。

与在 GPU 上使用 Rust 相关的其他项目

  • 2016年: glassful Rust 的一个子集,可以编译为 GLSL。
  • 2017年: inspirv-rust 实验性的 Rust MIR -> SPIR-V 编译器。
  • 2018年: nvptx 使用 rustc 的 nvptx 目标(使用 LLVM PTX 后端)的 Rust 到 PTX 编译器。
  • 2020年: accel 高级库,依赖于与 nvptx 相同的机制。
  • 2020年: rlsl 实验性的 Rust -> SPIR-V 编译器(rust-gpu 的前身)
  • 2020年: rust-gpu Rustc 代码生成后端,将 Rust 编译为 SPIR-V 以用于着色器,与我们的项目具有相似的机制。

许可证

根据您的意愿,许可协议为以下之一

贡献

除非您明确声明,否则根据Apache-2.0许可证定义,您有意提交以包含在作品中的任何贡献都将按上述方式双重授权,无需任何附加条款或条件。

依赖项

~1.5MB
~36K SLoC