1个版本 (0个不稳定版本)
1.0.0-alpha.7 | 2023年1月20日 |
---|
#1680 在 游戏开发
在 tictactoe_menace_player 中使用
27KB
276 行
井字棋 - MENACE版本
这是一个玩具项目,旨在创建一个可以由任何两个玩家玩的游戏。最终目的是以这种方式创建游戏,使其可以由人类和计算机玩。计算机将使用MENACE算法来学习如何玩游戏。
构建
平台 | Rust版本 | 状态 |
---|---|---|
Linux | 稳定 beta 夜间 MSRV (1.64.0) |
|
Windows | 稳定 beta 夜间 MSRV (1.64.0) |
|
macOS | 稳定 beta 夜间 MSRV (1.64.0) |
|
MENACE
机器可训练的井字棋引擎(MENACE)是第一个机器学习系统的实现之一。它由Donald Michie在1961年开发。原始系统是在一段时间内使用一叠火柴盒开发的,被称为火柴盒可训练的井字棋引擎(MENACE)。
这是第一个使用强化学习来学习玩游戏并证明机器可以学习玩游戏而不需要明确编程的系统。
经典的MENACE系统由304个火柴盒组成。每个火柴盒代表游戏的一种可能状态。每个火柴盒内部有几个珠子,珠子的数量和颜色代表下一步要做的移动。系统会玩一局井字棋并记录整个游戏中的移动。之后,根据游戏的结果(赢、输、平局),系统会通过向火柴盒中添加或移除珠子来“奖励”或“惩罚”系统。然后,系统会再玩一局并重复这个过程。
有关MENACE的更多信息,请参阅这里。
项目结构
此项目使用Cargo的工作空间功能将项目组织成多个crate。以下是对每个crate的简要描述
tttm
:这是一个二进制crate,负责实际运行游戏。随着进展,此crate计划托管与GUI或TUI的玩家交互。lib_ttt
:这是一个库crate,包含游戏的核心逻辑。此crate负责游戏逻辑、游戏状态和游戏规则。lib_player
:这是一个库crate,具有两个用途。首先,它为可以插入到游戏中的不同类型的玩家提供了通用接口。其次,它为人类玩家提供了一个基本实现。lib_menace_c
:这是一个库crate,实现了MENACE-C系统。该系统的实现基于lib_player
中定义的接口。lib_menace_s
:这是一个库crate,实现了MENACE-S系统。该系统的实现基于lib_player
中定义的接口。
MENACE实现
由于MENACE最初设计时不要求使用计算机,因此我们需要在将基于Matchbox的系统适配到基于计算机的系统时进行某些调整。在我们的实现中,我们将遵循以下原则:
- 火柴盒将由一个二维数组表示,数组中的每个值代表火柴盒中的珠子数量。
- 我们将使用HashMap来存储游戏的状态。键将是棋盘状态的字符串表示,值将是二维数组中火柴盒的索引。
此外,原始的MENACE实现使用了一个手动编写的可能的游戏状态列表,将旋转对称的棋盘状态视为等效。由于我们没有受到虚拟火柴盒数量的限制,我们将实现两种MENACE系统:
- MENACE-C:这将是一个经典的MENACE系统,将旋转对称的棋盘状态视为等效。
- MENACE-S:这将是一个将旋转对称的棋盘状态视为不同的MENACE系统。
路线图
该项目目前处于开发初期阶段。以下是在未来将实现的功能列表:
- 实现基础游戏逻辑.
- 实现人类玩家.
- 实现MENACE-C系统.
- 实现MENACE-S系统.
- 实现CLI.
- 添加TUI。可能使用tui-rs。
- 添加GUI。具体实现细节待定。
贡献
欢迎为该项目做出贡献。有关更多信息,请参阅贡献指南。
此项目支持Gitpod。您可以使用Gitpod在不安装任何依赖项的情况下贡献项目。只需点击下面的按钮即可启动Gitpod工作区。
许可
该项目同时受MIT许可和Apache许可证(版本2.0)的许可。
行为准则
该项目遵循贡献者行为准则。通过参与,您应遵守此准则。
致谢
该项目离不开Rust社区在推广和培训方面的努力。
我特别提到以下人员和项目:
- Chris Krycho和New Rustacean播客。
- Bogdan Pshonyak和Let's Get Rusty YouTube频道。
- Tris Oaten (NAMTAO)和他的No Boilerplate YouTube频道。
- 我的家人对我的支持和鼓励。