1个稳定版本
1.0.0 | 2019年11月20日 |
---|
#17 在#geobacter
6KB
126 行
🚧 Geobacter Rust编译器和运行时 🚧
什么是Geobacter?
Geobacter是一个支持单源加速器编程的框架,无需两次编译源代码。然而,Geobacter不是JIT;预期内核会被重复调用,且可能运行成本较高。事实上,由于单函数内核的特性,Geobacter启用了一些对于所有crate来说运行成本过高的LLVM选项。
Geobacter这个名字来源于第一种能够使用氧化铁作为电子受体氧化有机成分的细菌。
目前,AMDGPU和高性能计算是重点。
这是如何工作的?
在Rust类型系统中,每个fn
都有一个唯一的类型。因此,我们可以通过其类型来引用函数定义。在我们的Rust分叉中,我们使用特殊的由驱动定义的内建函数,本质上返回Rust编译器的ty::Instance<'_>
形式,以及针对所需目标的其他特定信息(例如,以支持SPIR-V管道描述)
在运行时,我们使用每个依赖的元数据重新池化编译器驱动(进入运行时驱动)。然后,我们查找真实的DefId
,并通过一些编译器提供者API技巧,让LLVM代码生成crate为相应的函数及其所有依赖生成IR。要清楚的是,这并不是JIT,而且不适合JIT式的操作;例如,我们启用了额外的LLVM优化,如Polly,以及增加优化搜索空间。因此,虽然优化相对较快,但对于JIT来说,它们太慢了。
存在一个进程内的缓存,形式为编译器生成的静态数据,因此内核不会为每个加速器目标进行多次代码生成。
状态(即什么工作,什么不工作)
一般情况下,直到 LLVM 优化为止的所有内容都适用于所有目标。在编译时为特定函数获取 ID 是可行的。在运行时,加载每个 crate 的元数据并使用这些数据来设置伪 Rust 驱动程序是可行的,同时执行上述函数 ID 的代码生成,包括优化,以及(如果适用)将其发送到目标机器的第二次运行也是可行的。
AMDGPU
此目标直接使用即可,尽管调度需要一些不安全性,因为仍然存在一些未解决的陷阱,例如将引用传递给设备不可访问的内存(如栈!)到内核中。此外,内核输出必须显式通过指针传递,因为 &mut
必须是唯一的,但所有工作项共享相同的参数值!
"额外"功能
- 良好的接口来指定内核启动界限并有效地获取工作项/工作组 ID,
- 设备可见的主机内存分配器,
- 设备内存分配,但不能用于
Box
等,因为无法保证大 BAR, - 设备纹理,
- 设备端信号,
- (主要是)安全 LDS(工作组内存)接口,适用于一些使用场景。
待办事项 🚧
- 更友好的交叉开关接口。
- 将 OpenCL std 函数适配到 Geobacter 等效函数。
- 安全的输出写入:两个工作项不得创建对同一变量的可变引用。
- 设备端排队:需要机制将子内核图像句柄嵌入到父内核中。
- 设备到主机 MPSC 通道。
Vulkan/SPIRV
Vulkan/SPIR-V 的支持远不如 AMDGPU,但“简单”的计算内核应该可以工作,目前还没有使用指南。
Geobacter 要求您的 Vulkan 实现支持物理存储缓冲区地址和变量指针扩展。
Cuda
无支持。
如何获取工具链?
目前,我们没有预构建的编译器可供下载,更不用说直接从 rustup
下载的能力。
因此,您需要自己构建 Rust 工具链。请参阅 BUILD.md。
待办事项 🚧 提供预构建包。
如何使用它进行编码?
请参阅 CODING.md! :^)
谁在开发此项目?
Richard Diamond 在业余时间开发此项目。
新贡献者绝对欢迎。
依赖项
~1.5MB
~36K SLoC