提供深度Q学习网络的生成器。允许随机训练间隔,并将更新为更稳定的版本。
所有者为Vidur。
#687 in 机器学习
12KB 287 行
这是一个Rust项目的库,用于强化学习。目前正在尝试实现训练dqn的变量比例策略。
~305KB