#博弈论 #强化学习 #玩家 #模型 #理论 #游戏 #建模

amfiteatr_classic

实现一些经典博弈论问题以供研究

7 个版本 (4 个重大更改)

0.5.0 2024年4月9日
0.4.1 2024年4月2日
0.3.0 2024年3月11日
0.2.1 2024年2月7日
0.1.0 2024年1月15日

#55 in 模拟

Download history 18/week @ 2024-04-12 3/week @ 2024-05-17 2/week @ 2024-05-24 3/week @ 2024-05-31 2/week @ 2024-06-07 1/week @ 2024-06-14

每月403次下载

自定义许可证

365KB
6K SLoC

Amfiteatr

用于建模博弈论问题并将强化学习应用于优化解决方案的框架。它旨在帮助建模涉及众多玩家的复杂问题。这是一个相当底层的建模框架,在许多情况下,Python 的等效框架可能更方便,但如果你希望使用 Rust 编译器来帮助你开发可信赖的代码,那么这个框架可能很有帮助。

成员 Crates

  1. amfiteatr_core (github) - 不包含强化学习的核心特性和泛型实现的 crate。
  2. amfiteatr_rl (github) - 扩展核心功能的 crate,提供强化学习(使用由 Torch 支持的神经网络)的接口和简单实现。
  3. amfiteatr_net_ext (github) - 目前提供使用 TCP 套接字在游戏模型实体之间提供通信的早期概念验证。
  4. amfiteatr_classic (github) - 提供 classic 博弈论游戏(如囚徒困境)模拟结构的 crate。
  5. amfiteatr_examples - 包含一些库使用示例的仓库。希望将来能进一步扩展。

其他项目

目前,我正在使用这个库开发一些项目,可以展示当前的可能性。

  1. brydz_model - 合约桥牌卡游戏的模拟和强化学习模型。可以作为实现4人游戏的示例。
  2. brydz_dd - 合约桥牌双盲解算器(游戏最佳解决方案的牌面朝上分析)的早期项目。警告它使用alpha-beta算法变体,在当前优化水平下,不能用于解决完整的52张牌问题。

开发阶段

这是我教育和研究项目。许多元素在未来将发生变化或消失,并且可能经常发生重大更改。我将及时添加功能和文档,并尝试简化目前似乎不便的接口。

TL;DR 它处于早期和不稳定阶段。

许可证:MIT


lib.rs:

此包提供处理经典博弈论问题的基础设施,例如

  1. 囚犯困境(或任何以2x2网格表示的游戏)
  2. 复制动态问题,基于以2x2网格表示的游戏。

依赖关系

~13MB
~267K SLoC