提供深度Q学习网络的生成器。允许随机训练间隔,并将更新为更稳定的版本。
所有者 Vidur。
#15 in #深度
12KB 287 行
一个基于Rust的项目,是一个强化学习库。目前正尝试实现一个用于训练dqn的变量比率策略。
~310KB