4 个版本
使用旧的 Rust 2015
0.0.3 | 2016 年 7 月 13 日 |
---|---|
0.0.2 | 2016 年 6 月 20 日 |
0.0.1 | 2016 年 6 月 8 日 |
0.0.0 | 2016 年 6 月 6 日 |
#35 in #matrix-multiplication
645KB
4K SLoC
RDS
Rust 数据科学是尝试在 Rust 下建立数据科学坚实基础的一个尝试。Rust 已经有几个科学/数据科学库,但我不满意它们的设计。遵循著名的 xkcd 笑话,这只是一个尝试。
当前的尝试缺乏 I/O 能力(主要是数组文件格式的读取/写入和绘图),因此需要在现实世界项目中使用额外的粘合剂。它们经常尝试在 Rust 中重新实现所有内容(甚至基本的 BLAS 操作),因此缺乏性能(有效的矩阵乘法很难)。如今,每个数据科学库都应该提供透明的多线程和 GPU 支持,但现有的实现要么因为计划得不够早而存在架构问题,要么局限于特定供应商的解决方案。
以下是我的计划,我知道它雄心勃勃,我没有截止日期。
计划
- array:支持常见文件格式(csv、numpy、hdf5、matlab 矩阵)的多维数组。
- blas:数组的 rusty blas 抽象,允许透明地使用 BLAS、clBLAS、cuBLAS。
- fft:数组的 fft 抽象,允许透明地使用 fftw、clFFT、cuFFT。
- plot:输出 jpeg、png、svg 图表的简单绘图库。
在这个基础上,我们可以希望开发用于线性代数、统计学、信号处理、机器学习、神经网络的附加包。
文档
它工作吗?
不,尝试 rusty-machine 或 rust-ndarray。
依赖关系
~1.5MB
~14K SLoC