#markov #rl #mdp #q-learning #sarsa

madepro

一个用于解决有限确定性马尔可夫决策过程(MDPs)的最小Rust库包

1 个不稳定版本

0.1.0 2024年1月13日

#1201 in 算法

MIT 许可协议

38KB
810

madepro

一个用于解决有限确定性马尔可夫决策过程(MDPs)的最小Rust库包。

局限性

这个库仍在开发中,不适合生产使用。它只实现了几个算法和一个环境。它也仅限于确定性MDPs。最初,我创建这个库只是为了重构我的关于 马尔可夫决策过程 的博客文章。然而,我决定在有时间的时候继续工作。未来,我首先想使库更加通用,然后添加更多算法和环境。

功能

库目前支持以下算法

路线图

以下功能计划在未来实现

  • 随机MDPs
  • 随机策略
  • 状态依赖的动作空间
  • 更多算法

依赖项

~305KB