2个版本

0.1.5-alpha.02023年3月25日
0.1.4-alpha.02023年3月3日

#15 in #increment

BSD-3-Clause

1MB
7K SLoC

caffe2op-fallbackgpu

一个Rust包,为DSP和机器学习计算中使用的某些数学运算符提供后备GPU实现。

注意:此包目前正在从C++转换为Rust,某些函数体可能仍在转换过程中。

此包包括对GPUFallbackOpGPUFallbackOpEx运算符的实现,当GPU实现不可用或当前系统不支持时,提供后备实现。`GPUFallbackOp`运算符是一个简单的实现,在CPU上执行运算符,而`GPUFallbackOpEx`是一个更高级的实现,使用OpenCL在GPU上执行运算符。

此外,此包还包括对`IncrementByOne`和`IncrementByOneOp`运算符的实现,这些运算符用于将张量的值增加一。这些运算符可以用作实现具有后备GPU支持的新的运算符的示例。

此包的主要目的是提供一个原型环境,用于在Rust中开发新的数学运算符,无需担心运算符在CPU或GPU上运行时的性能影响。通过提供后备GPU实现,此包允许开发者测试其实现的正确性并评估运算符在CPU和GPU上的性能,而无需编写单独的CPU和GPU实现。

使用后备GPU实现时的性能影响取决于各种因素,例如输入张量的大小、操作的复杂性和系统的硬件配置。一般来说,后备GPU实现可以提供比CPU实现更高的性能,但加速效果可能不如原生GPU实现明显。

总之,caffe2op-fallbackgpu是开发人员在Rust中实现新的数学运算符并希望评估其实现在CPU和GPU上性能的有用工具。

依赖项

~36MB
~401K SLoC