#game-theory #reinforcement-learning #model #player #game #theory

amfiteatr_net_ext

提供基本 TCP 通信的概念验证扩展

7 个版本 (4 个重大更新)

0.5.0 2024年4月9日
0.4.1 2024年4月2日
0.3.0 2024年3月11日
0.2.1 2024年2月7日
0.1.0 2024年1月15日

#140 in 模拟

Download history 146/week @ 2024-04-09 10/week @ 2024-05-21 2/week @ 2024-05-28 7/week @ 2024-06-04 5/week @ 2024-06-11

每月下载量 414
用于 brydz_model

自定义许可协议

255KB
4K SLoC

Amfiteatr

用于模拟博弈论问题和将强化学习应用于优化解决方案的框架。它旨在帮助建模涉及许多玩家的问题。这是一个相对底层的建模框架,在许多情况下,Python 的等价物可能更方便,但如果你希望 Rust 编译器帮助你开发可靠代码,这个框架可能很有帮助。

成员库

  1. amfiteatr_core (github) - 核心特性和泛型实现的库,不包含强化学习。
  2. amfiteatr_rl (github) - 扩展核心功能以提供强化学习接口和简单实现的库(使用由 Torch 支持的神经网络 (tch))。
  3. amfiteatr_net_ext (github) - 目前提供使用 TCP 套接字在游戏模型实体之间提供通信的早期概念验证
  4. amfiteatr_classic (github) - 提供模拟经典博弈论游戏结构(如囚徒困境)的库。
  5. amfiteatr_examples - 包含一些库使用示例的仓库。希望未来会进一步扩展。

其他项目

目前,我正在使用这个库开发一些项目,这些项目可以展示当前的可能性。

  1. brydz_model - 合同桥牌游戏的模拟和强化学习模型。可作为4人游戏实现的示例。
  2. brydz_dd - 合同桥牌双花色求解器的早期项目(对最优游戏解决方案的牌面朝上的分析)。警告它使用alpha-beta算法的变体,在当前优化水平下,不能用于解决完整的52张牌问题。

开发阶段

这是我教育和研究项目。许多元素在未来将发生变化或消失,并且可能会经常发生破坏性变化。我将适时添加功能和文档,并尝试简化目前看起来不方便的接口。

TL;DR 它目前处于早期且不稳定的阶段。

许可证:MIT

依赖关系

~8-19MB
~258K SLoC